期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
搜索引擎中Robot搜索算法的优化 被引量:21
1
作者 宋聚平 王永成 +1 位作者 滕伟 许欢庆 《情报学报》 CSSCI 北大核心 2002年第2期130-133,共4页
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种... 目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 。 展开更多
关键词 搜索引擎 超链接 robot pagerank 搜索策略 搜索模块 搜索算法 优化算法
下载PDF
对网页PageRank算法的改进 被引量:40
2
作者 宋聚平 王永成 +1 位作者 尹中航 滕伟 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第3期397-400,共4页
分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信... 分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信息 ,在 href、title等标记中文字对网页主题有重要作用 ,利用结构标记可以辅助判断网页的主题内容 .试验结果表明 。 展开更多
关键词 搜索引擎 网页 超链分析 pagerank
下载PDF
融合VSM技术的PageRank算法研究与应用 被引量:4
3
作者 李卫东 陆玲 《计算机与现代化》 2011年第7期96-98,101,104,共5页
为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数... 为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。 展开更多
关键词 pagerank算法 链接分析 向量空间模型 搜索引擎
下载PDF
Evaluation of the Importance of Web Pages
4
作者 宋聚平 Wang +4 位作者 Yongcheng YIN Zhonghang Zeng Yuming 《High Technology Letters》 EI CAS 2001年第4期23-26,共4页
Google’s algorithm on PageRank is analyzed in details. Some disadvantages of this algorithm is presented, for instance, preferring old pages, ignoring special sites and inaccurate judge of hyperlinks pointed out from... Google’s algorithm on PageRank is analyzed in details. Some disadvantages of this algorithm is presented, for instance, preferring old pages, ignoring special sites and inaccurate judge of hyperlinks pointed out from one page. Furthermore, author’s improved algorithm is described. Experiments show that the author’s consideration on evaluating the importance of pages can make an improvement over the original algorithm. Based on this improved algorithm a topic specific searching system have been developed. 展开更多
关键词 search engine Authority of pages pagerank hyperlink analysis
下载PDF
Web搜索中的数据挖掘技术研究 被引量:4
5
作者 耿桦 李媛 +1 位作者 朱炜 潘金贵 《计算机科学》 CSCD 北大核心 2005年第4期37-41,共5页
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖... WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。 展开更多
关键词 数据挖掘技术 WEB搜索 分布式信息系统 WEB挖掘技术 WEB内容挖掘 WEB结构 研究热点 资源搜索 研究分析 算法模型 搜索引擎 WWW 用户 智能型
下载PDF
循证医学信息化若干关键技术的研究 被引量:1
6
作者 李丹 鲁明羽 时丽莎 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第3期210-213,共4页
由于Web信息检索返回页面的数量巨大,对搜索结果进行排序成为影响搜索质量的一个重要问题。分析了搜索引擎Google采用的PageRank算法,指出其具有偏重旧网页和忽视专业站点的不足,考虑网页日期这一重要因素改进了PageRank算法,试验结果表... 由于Web信息检索返回页面的数量巨大,对搜索结果进行排序成为影响搜索质量的一个重要问题。分析了搜索引擎Google采用的PageRank算法,指出其具有偏重旧网页和忽视专业站点的不足,考虑网页日期这一重要因素改进了PageRank算法,试验结果表明,改进的算法可以提高判断网页重要性的准确度。最后介绍了如何通过个性化服务来发现与用户兴趣相似的资源。 展开更多
关键词 搜索引擎 网页排序 超链接 pagerank 个性化服务
下载PDF
基于超链接分析搜索引擎页面排序算法的剖析 被引量:6
7
作者 张书江 《安徽理工大学学报(自然科学版)》 CAS 2008年第2期73-77,共5页
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足... 对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。 展开更多
关键词 搜索引擎 超链接分析 页面排序 pagerank HITS
下载PDF
浅析搜索引擎的超链接分析排序算法
8
作者 梁永演 《晋图学刊》 2011年第4期34-36,共3页
本文以PageRank算法和HITS算法为例,对基于超链接分析技术的搜索引擎排序算法进行分析,并总结了超链接分析技术应用于搜索引擎结果排序的局限性。
关键词 搜索引擎 超链接 排序 pagerank 算法 HITS算法
下载PDF
基于垂直搜索引擎的网页排序算法研究 被引量:1
9
作者 钱永杰 曹宝香 《电子技术(上海)》 2015年第7期16-19,共4页
伴随着垂直搜索引擎领域的全面发展,为了满足人们对搜索引擎系统的高质量需求,通过深入剖析了Google经典的Page Rank算法,针对其单纯的考虑网页链接结构方面的不足,提出了改进的Page Rank算法。分析了网页文本结构、网页被抓取时间、网... 伴随着垂直搜索引擎领域的全面发展,为了满足人们对搜索引擎系统的高质量需求,通过深入剖析了Google经典的Page Rank算法,针对其单纯的考虑网页链接结构方面的不足,提出了改进的Page Rank算法。分析了网页文本结构、网页被抓取时间、网页内容相关度等问题,在此基础上对Page Rank算法进行改进,理论分析和仿真实验表明,改进后的算法具有更高的查准率和用户满意度。 展开更多
关键词 网页排序算法 垂直搜索引擎 pagerank算法 链接分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部