期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
搜索引擎中基于状态的Ajax动态网页提取研究 被引量:9
1
作者 陈莉莉 张丽 刘正龙 《计算机应用与软件》 CSCD 北大核心 2013年第7期217-220,共4页
Ajax(Asynchronous JavaScript and XML)动态网页的提取是目前搜索引擎研究的热点和难点。在分析已有Ajax动态网页提取方法的局限后,针对使用最广泛的基于DOM(Document Object Model)树的提取方法存在空间浪费和信息丢失的问题,引入状态... Ajax(Asynchronous JavaScript and XML)动态网页的提取是目前搜索引擎研究的热点和难点。在分析已有Ajax动态网页提取方法的局限后,针对使用最广泛的基于DOM(Document Object Model)树的提取方法存在空间浪费和信息丢失的问题,引入状态S的形式化定义,提出基于状态的页面元素、事件与函数绑定关系的提取算法AjaxCrawling,并说明算法提取得到的资源库在搜索引擎中的有效性。通过比较实验,得出AjaxCrawling具有保证提取到的信息的完整性和节约存储空间的优势。 展开更多
关键词 ajax技术 动态网页 提取 dom 状态
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部