期刊文献+

基于Python的专业网络爬虫的设计与实现 被引量:31

下载PDF
导出
摘要 网络爬虫,又称网页蜘蛛、网络机器人。随着计算机技术的高速发展,互联网中的信息量越来越大,搜索引擎应运而生。传统的搜索引擎会有返回结果不精确等局限性。为了解决传统搜索引擎的局限性,专用型网络爬虫在互联网中越来越常见。同时,专用型网络爬虫具有专用性,可以根据制定的规则和特征,最后只体现和筛选出有用的信息。
出处 《企业科技与发展》 2016年第8期17-19,共3页 Sci-Tech & Development of Enterprise
基金 2015年湖南省科技计划项目(项目编号:2015GK3024)"基于物联网的药品质量安全追溯系统" 湖南工业大学教学改革项目(项目编号:2013B11)"基于移动互联网的网络教学资源建设与成效研究" 湖南省教育厅科学研究项目(编号:13C036)"WEB数据挖掘在网络学习资源推荐系统中的应用研究"
  • 相关文献

参考文献2

二级参考文献17

  • 1陈红英,杨宜民.基于多智能体的网络信息系统的原理与实现[J].微电子学与计算机,2005,22(3):57-59. 被引量:2
  • 2吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量:48
  • 3余一娇.Google Linux Cluster的系统结构分析[EB/OL].(2006 -09 -02).http://www.uplooking.com/content/view/229/2/.
  • 4Paterson L.HTML4编程指南[M].徐征,冯文镛,陈晓良,等译.杭州:浙江科学技术出版社,2002:10-45.
  • 5Eichmann D. The RBSE Crawler-Balancing Effective Search Against Web Load[C]// Proc of the 1st Int'l World Wide Web Conf, 1994 : 113-120.
  • 6McBryan O A. GENVL and WWW: Tools for Taming the Web[C]//Proc of the 1st Int'l World Wide Web Conf, 1994 : 70-90.
  • 7Pinkerton B. Finding What People Want: Experiences with the WebCrawler[C]//Proc of the 2nd Int'l World Wide Web Conf,1994.
  • 8Cowie J, Lehnert W. Information Extraction[J]. Communications of the ACM, 1999,1 (1) : 80-91.
  • 9Shapiro D. Value-Driven Agents: [Ph D Thesis]. [D]. Stanford: Stanford University. 2001:23-128.
  • 10Barroso A,Dean J, Hlzle U. Web Search for a Planet: The Google Cluster Architecture[J]. IEEE Micro, 2003,23 (2) : 22-28.

共引文献58

同被引文献113

引证文献31

二级引证文献163

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部