支持AJAX的网络爬虫设计与实现被引量：2

Design and Implementation of AJAX-enabled Web Crawler

下载PDF

导出

摘要分析了Web2.0网络的网络爬虫面临的新挑战,对目前学术界出现的多种实现方案和策略进行了全面的综述,提出了AJAX爬虫的设计并加以实现,最后进行了实验验证,验证了这种AJAX Crawler能够很好地获取AJAX的动态页面,并与普通的爬虫在下载速度方面进行了对比。 The paper analyzes the new challenges to web crawler in Web2.0, and conducts a comprehensive overview of methods and strategy in current academic. Then the paper puts forward AJAXCrawler and implements it. At last, it makes experiments to verify that AJAXCrawler can do well in getting AJAX dynamic web pages, and makes a contrast with com- mon web crowler in download speed.

作者陆亮李东

机构地区哈尔滨工业大学计算机科学与技术学院

出处《智能计算机与应用》 2013年第6期57-59,62,共4页 Intelligent Computer and Applications

关键词动态网页 AJAX WEB2 0 网络爬虫 Dynamic Web Page AJAX Web2.0 Web Crawler

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1曾伟辉,李淼.基于JavaScript切片的AJAX框架网络爬虫技术研究[J].计算机系统应用,2009,18(7):169-171. 被引量：10
2FREYG. Indexing AJAX Web Applications[M].Zurich:Swiss Federal Institute of Technology Zurich,2007.
3MATTERR. AJAXCrawl:Making AJAX Applications Searchable[M].Zurich:Swiss Federal Institute of Technology Zurich,2008.
4MOZILLA. Rhino:JavaScript for Java[M].2009.
5金晓鸥,钟宝燕,李翔.基于Rhino的JavaScript动态页面解析研究与实现[J].计算机技术与发展,2008,18(2):1-4. 被引量：18
6郭浩,陆余良,刘金红.一种基于状态转换图的Ajax爬行算法[J].计算机应用研究,2009,26(11):4266-4269. 被引量：6
7王映,于满泉,李盛韬,王斌,余智华.JavaScript引擎在动态网页采集技术中的应用[J].计算机应用,2004,24(2):33-36. 被引量：36

二级参考文献23

1苏杭,严建援.一种新的Web链接提取模型[J].清华大学学报（自然科学版）,2006,46(z1):975-982. 被引量：4
2Jesse James Garrett. Ajax: A New Approach to Web Applications.http://www.adaptivepath.com/ideas/essay s/archives/000385.php2005.
3Alvarez M, Pan A, Raposo J, Vina A. Client-Side Deep Web Data Extraction ext ended paper, http://www.tic. udc.es/-mad/publications/csdeepweb_extended.pdf.
4Steindl C. Program slicing for object-oriented programmming languages [PhD Thesis]. Johannes Kepler University Linz. 1999.
5Weiser M. Program slicing. IEEE Transactions on Software Engineering, July1984.
6Ottenstein K J, Ottenstei LM. The program dependence graph in a softwaredevelopment environment. Proceedings of the ACM SIGSOFT/SIGP LAN software Engineering Sysposium on Practical Software Development Environments, ACM SIGPLAN Notices. 1984,19(5).
7GARRETT J J. Ajax:a new approach to Web applications[ EB/OL]. (2005) [ 2008-10-08 ]. http ://www. adaptivepath.com/publications/ essays/archives/000385, php.
8Ajaxian Community. Ajax tools usage survey results [ EB/OL ]. (2007). [ 2008- 10- 09 ]. http://ajaxian.com/archives/2007-ajaxtools-usage-survey-results/.
9SHAH S. Crawling Ajax-driven Web 2.0 applications[ R]. 2007.
10FREY G. Indexing Ajax Web applications [ D ]. Zurich: Swiss Federal Institute of Technology, 2007.

共引文献58

1陈健瑜.网页动态页面采集关键技术研究[J].硅谷,2009,2(12):68-68. 被引量：1
2王莎.基于Internet的EDI[J].中国科技信息,2006(6):227-227. 被引量：2
3李政,孟德光,董艳英,鲁艳丽,姚素玲.网络课程通用术语查询系统设计[J].河北科技师范学院学报,2006,20(3):44-47.
4金晓鸥,钟宝燕,李翔.基于Rhino的JavaScript动态页面解析研究与实现[J].计算机技术与发展,2008,18(2):1-4. 被引量：18
5曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,17(5):122-126. 被引量：39
6曾伟辉,李淼.基于JavaScript切片的AJAX框架网络爬虫技术研究[J].计算机系统应用,2009,18(7):169-171. 被引量：10
7方宏,吕太之.求职网站职位列表页链接信息的自动提取[J].现代图书情报技术,2009(7):93-96. 被引量：3
8胡燕,嵇启春,赵佳,王瑞.开放式实验室管理信息系统设计[J].现代计算机,2009,15(8):141-142. 被引量：1
9方宏,吕太之.动态网页信息提取技术在求职搜索中的应用[J].计算机工程,2009,35(24):265-267. 被引量：2
10范轩苗,郑宁,范渊.一种基于Ajax的爬虫模型的设计与实现[J].计算机应用与软件,2010,27(1):96-99. 被引量：3

同被引文献6

1杨俊峰,黎建辉,杨风雷.深层网站Ajax页面数据采集研究综述[J].计算机应用研究,2013,30(6):1606-1610. 被引量：26
2陈莉莉,张丽,刘正龙.搜索引擎中基于状态的Ajax动态网页提取研究[J].计算机应用与软件,2013,30(7):217-220. 被引量：9
3郭津丞,冯超,张磊.基于WebKit的网络爬虫[J].现代电子技术,2013,36(18):62-64. 被引量：3
4方雪峰,唐珂,夏海军,毛晓丽.基于网络原型挖掘的AjaxCrawler系统研究[J].电子技术与软件工程,2013(18):25-27. 被引量：1
5刘媚,王旭阳.基于Comet技术的WEB实时性应用的研究[J].无线互联科技,2016,13(3):9-10. 被引量：1
6文爱平,文德民,.基于IE浏览器的Ajax Comet架构[J].电脑知识与技术（过刊）,2010,0(17):4646-4648. 被引量：7

引证文献2

1肖婧.基于反向Ajax技术的终端驱动Web服务[J].电子技术与软件工程,2017(1):56-58. 被引量：1
2孙龙,李彦.基于AJAX的深网爬虫设计[J].现代计算机,2017,23(19):72-75. 被引量：1

二级引证文献2

1陈龙,舒坚.基于物联网的大棚智能监控系统的数据处理与显示[J].信息通信,2017,30(9):87-90. 被引量：1
2陶雪娇.基于Python的异步数据采集与预处理[J].电子元器件与信息技术,2024,8(7):24-26.

1高莎莎.浅谈计算机网络建设中的安全问题及对策[J].无线互联科技,2013,10(1):21-21. 被引量：3
2马兰馨,安德海,刘宝旭,刘瑞荣,吴春珍,许榕生,于传松.高能所计算机网络反垃圾邮件方案[J].核电子学与探测技术,2005,25(3):334-336. 被引量：1
3郭浩,陆余良,刘金红.一种基于状态转换图的Ajax爬行算法[J].计算机应用研究,2009,26(11):4266-4269. 被引量：6
4张微波.浅谈城域传送网的接入方案和策略[J].科技与生活,2010(15):37-37.
5田建勇.浅析基于网格安全技术的研究与实现[J].电脑知识与技术（过刊）,2012,18(4X):2499-2501.
6姜洋洋.虚拟化技术下的云安全问题[J].现代工业经济和信息化,2014,4(12):65-66. 被引量：1
7贾玲玲,李伯刚,苗青.热力站无人值守智能监控系统设计方案[J].区域供热,2016(2):17-24. 被引量：11
8庞焱.医院数据库安全管理解决方案探讨[J].技术与市场,2014,21(7):242-243. 被引量：4
9王旭俊.电力调度自动化二次系统安全防护综述[J].华东科技（学术版）,2013(5):225-225. 被引量：3
10邹洋.中国移动电子商务技术应用分析报告[J].电脑与信息技术,2014,22(3):64-67. 被引量：1

智能计算机与应用

2013年第6期

浏览历史

内容加载中请稍等...

支持AJAX的网络爬虫设计与实现被引量：2

参考文献7

二级参考文献23

共引文献58

同被引文献6

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

支持AJAX的网络爬虫设计与实现 被引量：2

参考文献7

二级参考文献23

共引文献58

同被引文献6

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

支持AJAX的网络爬虫设计与实现被引量：2