期刊文献+

爬虫技术在大数据领域中的应用分析 被引量:7

下载PDF
导出
摘要 在物联网技术迅速发展的背景下,网络数据呈现出爆炸式增长,对数据的应用需要在大量数据中记性挖掘搜索,搜索引擎结合这一需求就应运而生,不只是搜索数据信息,还要帮助人们找到需要的结果被人们所应用。信息数据的处理就需要爬虫技术加以应用来收集网络信息,基于此,本文先就爬虫技术的类型和发展趋势加以阐述,然后就大数据领域中爬虫技术实际应用方法详细探究,希望能从理论的研究下,为爬虫技术的应用推广起到促进作用。
作者 舒万畅
出处 《科学技术创新》 2018年第36期91-92,共2页 Scientific and Technological Innovation
  • 相关文献

参考文献7

二级参考文献56

  • 1Hemovici M, Jacovi M, Maarek Y S, et al. The Shark-Search Algorithm: An Application:Tailored Web Site Mapping[ C ]//Proceedings of the7th international World Wide Web 7 conference. Brisbane, Australia, 1998.
  • 2Joson Rennie, Andrew Kachites McCallum. Using reinforcement learning to spider the web efficiently[ C ]//Proceedings of the 16th International Conference on Machine Learning( ICML - 99 ). Bled, Slovenia, 1999:335 - 343.
  • 3Diligenti M, Coetzee F, Lawrence S, et al. Focused crawling using context graphs. Proceedings of the 26th International Conference on Very Large Database ( VLDB2000), 2000:527 - 534.
  • 4Aggaewal C, A1-Garawif Yup. Intelligent crawling on the World Wide Web with arbitrary predicates[ C ]//Proc of the 10th International WoAd Wide Web Conference. HongKong: [ S n] ,2001.
  • 5Maenehea Ehrig. Ontology-focused crawling of Web documents[ C ]//Proc of ACM Symposium on Applied Computing ,2003.
  • 6Chakrabarti S, Punera K, Subramanyam M. Accelerated Focused Crawling through Online Relevance Feedback [ C ]//Proceedings of the 11 th International Conference on World Wide Web, Hawaii, USA ,2002 : 148 - 159.
  • 7Cai Rui, Yang Jiang-ming, Wei lai. iRobot: An Intelligent Crawler for Web Forums [ A ]//Proceedings of the 17th International world Wide Web Conference[ C ]. ACM Press ,2008:447 - 456.
  • 8Duskin O, Dror G. Feitelson distinguishing humans from robots in Web search logs:Preliminary results using query rates and intervals [ C ]// Proceedings of the 2009 Workshop on Web Search Click Data, New York :ACM ,2009:15 -19.
  • 9刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29. 被引量:131
  • 10Cafarella M J, Madhavan J, Halevy A. Web-scale extraction of structured data [J]. SIGMOD Record, 2008, a7 (4): 55-61.

共引文献62

同被引文献72

引证文献7

二级引证文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部