基于检索相关度拓展的网页排名技术:IR-REL
摘要
SEO SPAM和飞速发展的网页规模要求更优的网页排名技术,在研究链接分析技术PageRank及互信息模型后,提出了检索相关度算法(IR-REL),构建相关词链表计算网页的布尔权重。该排名同时将权威度和相关度作为影响因子,可提高检索相关度,降低关键词作弊影响。文章给出了具体的排名策略、实验数据和系统模型。
出处
《情报杂志》
CSSCI
北大核心
2006年第4期92-94,共3页
Journal of Intelligence
参考文献9
-
1Guang Feng,Tie -Yan Liu,Xu-Dong Zhang,et al.Level-Based Link Analysis.Springer-Verlag Berlin Heidelberg:APWeb 2005,LNCS 3399,2005.
-
2Gianluigi Greco,Sergio Greco Ester Zumpano.A Probabilistic Approach for Distillation and Ranking of Web Pages.World Wide Web,2001.
-
3Sergey Brin and Lawrence Page.The Anatomy of a Large-Scale Hypertextual Web Search Engine.http:// www.db.stanford.edu/backrub/google.html,1998.
-
4Tomohiko Sugimachi,Akira Ishino.A Method of Extracting Related Words Using Standardized Mutual Information.Springer-Verlag Berlin Heidelberg:LNAI 2843,2003.
-
5Leonidas Fegaras.XQuery Processing With Relevance Ranking.Z.Bellahsene et al.(Eds.):XSym 2004,LNCS 3186,2004.
-
6Peter D.Turney.Mining the Web for Synonyms:PMI-IR verus LSA on Toefl.In European Conference on Machine Learning,2001.
-
7Krishna Bharat,George A.Mihaila.Hilltop:A Search Engine based on Expert Documents.http://www.cs.toronto.edu/georgem/hilltop/,2004.I0
-
8Masahiro Kimura,Kazumi Saito,et al.Detecting Search Engine Spam from a Trackback Network in Blogspace.Springer-Verlag Berlin Heidelberg 2005.
-
9Han EH,Karypis G.Gentroid-Based Document Classification:Analysis&Experimental Resuts.http://www.users.itlabs.umn.edu/karypis/publications/data-mining.html,2000.
-
1任莉莉,方元康.基于词汇链与互信息的关键词抽取研究[J].池州学院学报,2013,27(6):48-50. 被引量:1
-
2胡炜.垃圾网页的搜索引擎优化技术研究[J].数字技术与应用,2011,29(11):124-125.
-
3刘海峰,陈琦,张以皓.一种基于互信息的改进文本特征选择[J].计算机工程与应用,2012,48(25):1-4. 被引量:15
-
4张金增,孟小峰.移动Web搜索研究[J].软件学报,2012,23(1):46-64. 被引量:13
-
5何翔,顾春华,丁军.基于微博的主题社区发现[J].计算机应用与软件,2013,30(6):209-213. 被引量:3
-
6张绛丽,刘伟唯.搜索引擎的排序技术与Web信息的可访问性[J].山西电子技术,2004(6):17-18.
-
7李其申,徐媛.基于频域的遥感图像互信息配准方法[J].计算机工程与应用,2009,45(35):161-163.
-
8雷一鸣,刘勇,霍华.面向网络语言基于微博语料的新词发现方法[J].计算机工程与设计,2017,38(3):789-794. 被引量:11
-
9刘悦,杨志峰,程学旗,王斌.利用链接分析技术提高搜索引擎查找质量的研究[J].微电子学与计算机,2002,19(5):18-21. 被引量:8
-
10瞬雨.谁背离了搜索引擎的梦想——搜索结果欺诈下的竞价排名[J].互联网天地,2008(8):7-7. 被引量:2