期刊文献+

链接分析对主题爬虫的改进 被引量:12

下载PDF
导出
摘要 在分析总结两种主题爬虫设计的基础之上,研究了用链接分析改进主题爬虫的方法。通 过实验,比较引入链接分析前后的结果,论证了其设计可行性与可操作性,为实现定向信息采集奠定 了良好的基础。
作者 汪涛 樊孝忠
出处 《计算机应用》 CSCD 北大核心 2004年第B12期174-176,共3页 journal of Computer Applications
  • 相关文献

参考文献3

二级参考文献11

  • 1[5]Page L, Brin S, Motwani R, et al. The PageRank citation ranking: Bringing order to the Web[EB/OL]. http:∥www-db.stanford.edu/~backrub/pageranksub.ps,1998-01-20/2003-03-25.
  • 2R. Baeza Yates, B. Ribeiro Neto. Modern Information Retrieval ACM Press,1998
  • 3Google inc. http: //www. google. com
  • 4Dell Zhang, Yisheng Dong. An Efficient Algorithm to Rank Web Resources.The 9th International World Wide Web Conference, 2000. http: //www9. org/w9cdrom/251/251. html
  • 5Jon Kleinberg. Authoritative Sources in a Hyperlinked Environment. Journal of the ACM, 1999;46(5)
  • 6L. Page, S. Brin, R. Motwani, T. Winograd. The PageRank Citation Ranking: Bringing order to the Web. http://www - db. stanford. edu/~ backrub /pageranksub.ps, January, 1998.
  • 7S. Brin, L. Page The Anatomy of a Large- scale Hypertextual Web Search Engine Computer Networks and ISDN Systems, 1998
  • 8Arvind Arasu, Junghoo Cho. Hector Garcia - Molina, Andreas Paepcke, Sriram Raghavan. Searching the Web. ACM Transactions on Intemet Technology,2001 ;1(1)
  • 9Taher Haveliwala. Effcient Computation of Pagerank. Technical Report 1999 -31, Database Group, Computer Science Department, Stanford University,February 1999. http: //dbpubs. stanford. edu /pub/1999 - 31.
  • 10李盛韬,吴丽辉,于满泉,潘文锋,余智华,王斌,程学旗.主题Web信息采集的研究与设计[A]语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集,2003.

共引文献114

同被引文献194

引证文献12

二级引证文献53

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部