摘要
从Ajax链接元素的识别、页面状态标识、页面状态可控性转换、页面状态内容动态获取和状态重复检测5个方面介绍Ajax数据采集所取得的最新研究进展,总结系统的整体处理流程和支撑技术,探讨新的发展趋势,推动Ajax数据采集问题展开更为深入的研究。
This paper introduces the recent advances achieved from five aspects, which include Ajax link elements judgment, page state identification, page state controllable transformation, content extraction and duplicated states detection. The overall processing flow and the relevant supporting technologies are summarized, and the new research trends are discussed. This study will be helpful to promote the further research on Ajax data collection issues.
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第3期52-57,共6页
New Technology of Library and Information Service
基金
国家社会科学基金项目"Web2.0环境下的网络舆情采集与分析"(项目编号:09CTQ027)
中国人民大学科学研究基金项目"Web2.0网站的数据采集研究"(项目编号:22382078)的研究成果之一