摘要
先从网页内容和网页链接的角度计算网页与主题的相似度,然后将二者归一化,最终确定网页与主题的相关度。从分析网页内容相似度的角度保证网页与主题的相关性,从网页链接分析的角度解决网页搜索的权威性和覆盖率。算法还对PageRank算法进行了改进,将访问网页的概率加入到算法计算过程中,实验结果表明,新的算法具有较高的搜索效率。
出处
《情报杂志》
CSSCI
北大核心
2008年第6期64-66,共3页
Journal of Intelligence
基金
山东省自然科学基金资助项目(编号:2005G21)