期刊文献+

一种基于网页内容和链接分析的主题搜索算法 被引量:6

A Subject Searching Algorithm Based on Web Contents and Web Links Analysis
下载PDF
导出
摘要 先从网页内容和网页链接的角度计算网页与主题的相似度,然后将二者归一化,最终确定网页与主题的相关度。从分析网页内容相似度的角度保证网页与主题的相关性,从网页链接分析的角度解决网页搜索的权威性和覆盖率。算法还对PageRank算法进行了改进,将访问网页的概率加入到算法计算过程中,实验结果表明,新的算法具有较高的搜索效率。
机构地区 山东师范大学
出处 《情报杂志》 CSSCI 北大核心 2008年第6期64-66,共3页 Journal of Intelligence
基金 山东省自然科学基金资助项目(编号:2005G21)
  • 相关文献

参考文献6

  • 1吴安清,张颖江,涂军.主题搜索ROBOT综合爬行策略的研究[J].武汉理工大学学报,2006,28(2):74-76. 被引量:6
  • 2Bra D P, Houben G, Kornatzky et al. Information Retrieval in Distributed Hypertexts[ C]. In:Porc. of the 4th RIAO Conference, 1994
  • 3Cho J,Gareia- MolinaH, Page L. Efficient Crawling through URL Ordering[J]. Computer Networks, 1998,30( 1 - 7) : 161 - 172
  • 4Page L, Brin S, Motwani R, et al. The Pagerank Citation Ranking: Bringing Order to he Web[R]. Standfrd Digital Libraries SIDL - W P - 1999- 0120,1999
  • 5Bharat K, Henznger. Improved Algorithms for Topic Distillation in A Hypcrlinked Environment[ C]. In: Proc. of SIGIR Conference on Research and Development in Information Retrieval, 1998
  • 6钱功伟,倪林,MIAO Yuan,曹荣.基于网页链接和内容分析的改进PageRank算法[J].计算机工程与应用,2007,43(21):160-164. 被引量:25

二级参考文献15

  • 1欧阳柳波,李学勇,李国徽,王鑫.专业搜索引擎搜索策略综述[J].计算机工程,2004,30(13):32-33. 被引量:34
  • 2DeBra P,Houben G,Kornatzky Y,et al.Information Retrieval in Distributed Hypertexts[A].Proc 4th RIAO Conference[C].New York:Computer-assisted Information Retrieval,1994.481~491.
  • 3Michael Herseovici,Michal Jacov,Yoelle S Maarek.The Shark-Search Algorithm-An Application:Tailored Web Site Mapping[J].Computer Networks and ISDN Systems,1998,30:317~326.
  • 4Page L,Brin S,Motwani R,et al.The pagerank citation ranking:Bringing order to the web[R].Stanford Digital Libraries SIDL-WP-1999-0120,1999.
  • 5Kleinberg J.Authoritative sources in a hyperlinked environment[C]//Proceedings of the Ninth Annual ACMSIAM Symposium on Discrete Algorithms,San Francisco,California,1998:668-677.
  • 6Xing Wenpu,Ghorbani A.Weighted PageRank Algorithm[C]//Communication Networks and Services Research,Proceedings of Second Annual Conference on 19-21 May 2004:305-314.
  • 7Havelieala T H.Topic-sensitive PageRank[C]//Proceedings of the 11th International World Wide Web Conference,Hawaii,2002:517-526.
  • 8Heydon A,Najork M.Mercator:a scalable,extensible web crawler[J].World Wide Web Journal,1999:219-229.
  • 9计算所汉语词法分析系统ICTCLAS[EB/OL].http://www.ict.ac.cn/freeware/003_ictclas.asp.
  • 10Haveliwala T.Efficient computation of pagerank[R].Stanford University,Stanford,CA,1999.

共引文献29

同被引文献37

引证文献6

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部