期刊文献+

网络爬虫技术研究与分析 被引量:1

下载PDF
导出
摘要 随着因特网的飞速发展、网络信息的增多,用户要在如此大的海洋信息中找出自己所需的内容,就像大海捞针一样,为了解决这个问题,网络爬虫随之诞生。本文分析了目前网络爬虫的历史现状和发展趋势,对当前的爬虫技术进行分析。宽度优先搜索网络爬虫技术,对URL进行分析、去重,同时根据关键字在网页正文中进行匹配并使用多线程技术,让爬虫效率更高,具备更强大的抓取能力。
出处 《城市地理》 2016年第6X期227-227,共1页 City Geography
  • 相关文献

参考文献1

二级参考文献6

  • 1[2]Michelangelo Diligenti,Frans Coetzee,Steve Lawrence,et al.Focused Crawling using Context Graphs[J],Intemational Conference on Very Large Databases.2002,(26):527-534.
  • 2黄萱菁,吴立德.独立于语种的文本分类方法[J].2000 International Conference on Multilingual Information Processing,2000,:37-43.
  • 3鲁松,白硕.文本中词语权重计算方法的改进[J].2000 International Conference on Multilingual Information Proeessing,2000,:31-36.
  • 4[5]Google 的 PageRank 算法[EB/OL].[2003-12-18].http://blog.xdanger.com/archives/2003/12/18/000046.html.
  • 5[6]朱炜,王超,李俊,等.WEB超链分析算法纵纵览[EB/OL].[2005-08-02].http://www.tjgan gyuan.com/seo/show-article.asp?id=450.
  • 6叶允明,于水,马范援,宋晖,张岭.分布式Web Crawler的研究:结构、算法和策略[J].电子学报,2002,30(12A):2008-2011. 被引量:23

共引文献14

同被引文献6

引证文献1

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部