期刊文献+

基于扩散理论的HITS算法在Web挖掘中的研究与优化 被引量:10

Research and optimization of HITS based on theory of diffusion in Web mining
下载PDF
导出
摘要 传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题。针对上述问题进行研究与分析,将超链接信息检索方法与页面内容相结合,根据优先情节和增长定律,提出了一种改进的基于扩散理论的HITS算法。实验结果表明,与传统的HITS和SALSA算法相比,该HITS算法能够有效地限制主题偏离,提高搜索精度,具有较高的实用价值。 Traditional HITS simply analyzes the link structure of Webs while ignores the research of Web content and Web reference amplification,which results in topic deviation phenomenon.This paper in terms of the above issues to come up with a novel optimization of HITS based on the theory of diffusion.This method on the basis of priority complex and growth theorems to combine hyperlink information retrieval and Web content analysis together to improve the search accuracy of HITS.Experimental results show that compared with SALSA and the traditional HITS,the improved HITS is able to effectively restrain the topic deviation,increases the search accuracy with high practical value.
出处 《计算机应用研究》 CSCD 北大核心 2012年第1期145-147,共3页 Application Research of Computers
基金 国家自然基金资助项目(60803074)
关键词 HITS 网页链接增幅 主题偏离 优先情节 扩散理论 HITS Web reference amplification topic deviation phenomenon priority complex diffusion theory.
  • 相关文献

参考文献5

二级参考文献38

  • 1吴共庆,陈恩红.一种基于XML的半结构化数据存储方法[J].计算机工程,2004,30(10):57-59. 被引量:11
  • 2韩江洪,郑淑丽,魏振春,蒋建文,吴永忠.面向XML的Web数据模型研究[J].小型微型计算机系统,2005,26(4):609-613. 被引量:5
  • 3杨占华,杨燕.数据挖掘在智能搜索引擎中的应用[J].微计算机信息,2006,22(04X):244-246. 被引量:22
  • 4蔡明,张体首.基于本体的搜索引擎研究[J].微计算机信息,2006(12X):242-244. 被引量:14
  • 5CHAKRABARTI S,DOM B,RAGHAVAN P,et al.Automatic resource compilation by analyzing hyperlink structure and associated text[J].Computer Networks and ISDN Systems,1998,30(4):1-7.
  • 6GEVREY J,RUGER S.Link-based approaches for text retrieval.Proceedings of TREC- 10,NIST(Gaithersburg,MD,13-16Nov2001) [M].NIST Special Publication,2002.
  • 7XINGW, GHORBANIA. Weighted pagerank algorithm[C].Proceedings of the Second Conference on Communication Networks and Services Research, 2004: 305- 314.
  • 8KOSALA R, BLOCKEEL H. Web mining research: A Survey. ACMSIGKDD, 2000(07).
  • 9MIZUUCHI Y. Finding Context Paths for web pages[J]. InProc. of ACM Hypertext, 1999,2(2) : 13-22.
  • 10BORODIN A, ROBERTS G O, Rosenthal J S, etal.Finding authorities and hubs form link structures on the World Wide Web[C]. In Web, Hong Kong, China, May 2001.

共引文献23

同被引文献85

引证文献10

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部