期刊文献+

社区网络爬虫的设计与实现 被引量:10

Design and Implementation of the Social Network Crawler
下载PDF
导出
摘要 社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值,由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面为粒度,该爬虫以人为最小粒度,并以人与人之间的关系为抓取依据,在获取这类数据上有很好的性能。 Social network is a new type of intemet based on users' creating contents ,which is of higlaly statistical value. Because of the limit of access and frequent updating, traditional web crawlers are difficult to obtain this part of data. This paper designs and implements an automatic crawler which can login and intelligently grab reptiles of data according to the speed of update frequency. This crawler is different from before for it is based on one person but not page ,and it relies on the relationship between persons, so it is of very good performance for this type of data.
作者 郭涛 黄铭钧
出处 《智能计算机与应用》 2012年第4期65-67,共3页 Intelligent Computer and Applications
关键词 社区互联网 智能爬虫 数据挖掘 Social Network Smart Web Crawler Data Mining
  • 相关文献

参考文献4

  • 1CAI R;YANG J M;LAI W.iRobot:an intelligent crawler for Web forums[A]北京,2008447-456.
  • 2BREWINGTON B,CYBENKO G. How dynamic is the web[J].Computer Networks,2000.257-276.
  • 3FETTERLY D,MANASSE M,NAJOR. A large-scale study of the evolution of Web pages[A].New York:acm Press,2003.669-678.
  • 4孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量:22

二级参考文献3

共引文献21

同被引文献55

引证文献10

二级引证文献88

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部