期刊文献+

融合VSM技术的PageRank算法研究与应用 被引量:4

Research and Application of PageRank Algorithm Combined with VSM Technique
下载PDF
导出
摘要 为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。 In order to solve the "Topic Drift" problem of PageRank algorithm,this paper proposes an improved method combined with VSM(vector space model) technique.First,it computes PageRank value by hyperlink structure of Web page,then builds vector space model of Web page content and computes topic content similarity.Finally it sums up new PageRank value according these two values by certain weight coefficient.Contrast experiments show that improved PageRank algorithm reduces the quantity of irrelevant Web page and provides better sorting results for search engine.
作者 李卫东 陆玲
出处 《计算机与现代化》 2011年第7期96-98,101,104,共5页 Computer and Modernization
关键词 PAGERANK算法 链接分析 向量空间模型 搜索引擎 PageRank algorithm hyperlink analysis vector space model search engine
  • 相关文献

参考文献13

  • 1中国互联网络信息中心.第27次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn.2011-01-19.
  • 2百度百科.PageRank算法[EB/OL].http://baike.baidu.com/view/1518, htm,2011-04-02.
  • 3高琪,张永平.PageRank算法中主题漂移的研究[J].微计算机信息,2010,26(9):117-119. 被引量:13
  • 4维基百科.VSM(向量空间模型)[EB/OL].http://zh.wikipedia.org/wiki/向量空间模型,2011-04-02.
  • 5Page L, Brin S. The PageRank Citation Ranking: Bringing Order to the Web [ EB/OL]. http ://ilpubs. stanford, edu : 8090/422/1/1999-66. pdf,2011-04-02.
  • 6Brin S, Page L. The anatomy of a large-scale hypertextual Web search engine[ J]. Computer Networks and ISDN Sys- tems, 1998,30 ( 1-7 ) : 107-117.
  • 7Oren Zamir, Oren Etzioni. Grouper.A dynamic clustering interface to Web search results [ J ]. Computer Networks, 1999 (31) :58-63.
  • 8百度百科.相关性排序[EB/OL].http ://baike. baidu.corn/view/1122735, html? fromTaglist,2011-04-08.
  • 9Salton G,Yang C S. On tile specification of term values inautomatic indexing[ J ]. Journal of Documentation, 1973,29 (4) :351-372.
  • 10Salton G, Mcgil M J. Introduction to Modem Information Retrieval [ M ]. McGraw-Hill, Inc., New York, NY, USA, 1986.

二级参考文献28

共引文献257

同被引文献45

引证文献4

二级引证文献60

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部