期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
Weighted PageRank Algorithm Search Engine Ranking Model for Web Pages 被引量:1
1
作者 S.Samsudeen Shaffi I.Muthulakshmi 《Intelligent Automation & Soft Computing》 SCIE 2023年第4期183-192,共10页
As data grows in size,search engines face new challenges in extracting more relevant content for users’searches.As a result,a number of retrieval and ranking algorithms have been employed to ensure that the results a... As data grows in size,search engines face new challenges in extracting more relevant content for users’searches.As a result,a number of retrieval and ranking algorithms have been employed to ensure that the results are relevant to the user’s requirements.Unfortunately,most existing indexes and ranking algo-rithms crawl documents and web pages based on a limited set of criteria designed to meet user expectations,making it impossible to deliver exceptionally accurate results.As a result,this study investigates and analyses how search engines work,as well as the elements that contribute to higher ranks.This paper addresses the issue of bias by proposing a new ranking algorithm based on the PageRank(PR)algorithm,which is one of the most widely used page ranking algorithms We pro-pose weighted PageRank(WPR)algorithms to test the relationship between these various measures.The Weighted Page Rank(WPR)model was used in three dis-tinct trials to compare the rankings of documents and pages based on one or more user preferences criteria.Thefindings of utilizing the Weighted Page Rank model showed that using multiple criteria to rankfinal pages is better than using only one,and that some criteria had a greater impact on ranking results than others. 展开更多
关键词 Weighted pagerank algorithms search engines web pages web crawlers World Wide Web
下载PDF
Google搜索引擎的PageRank技术及其优化研究 被引量:1
2
作者 黄知义 周宁 《图书馆学研究》 2005年第8期21-23,共3页
本文重点分析了Google搜索引擎的PageRank技术的实现算法、优点及不足之处,并提出利用行为反馈再排序机制进行优化。
关键词 搜索引擎 google pagerank技术 优化 pagerank 优化研究 技术 重点分析 不足之处 算法
下载PDF
Google搜索引擎的核心——PageRank算法综述 被引量:3
3
作者 余小兵 《电脑与电信》 2006年第12期4-6,共3页
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并... 搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并讨论了它的应用情况。 展开更多
关键词 pagerank 搜索引擎 算法
下载PDF
搜索引擎Google的体系结构及其核心技术研究 被引量:8
4
作者 王德峰 李东 《哈尔滨商业大学学报(自然科学版)》 CAS 2006年第1期84-87,共4页
Google采用了并行,索引桶,数据压缩,PageRank算法等的技术,建立了复杂的体系结构,包括网络爬行机器人crawler、知识库Repository、索引系统(包括索引器indexer,桶barrels,文件索引等)、排序器Sorter和搜索器Searcher五个部分.Google的r... Google采用了并行,索引桶,数据压缩,PageRank算法等的技术,建立了复杂的体系结构,包括网络爬行机器人crawler、知识库Repository、索引系统(包括索引器indexer,桶barrels,文件索引等)、排序器Sorter和搜索器Searcher五个部分.Google的rank系统综合了词频,类型,相邻度,网页重要性等因素.其中最值得一提的是计算网页重要性的PageRank算法,它把文献检索的引用理论应用到Web中,即一个网页有很多网页指向它,或者一些重要的网页指向它,则这个网页很重要.PageRank算法大大提高了检索效率. 展开更多
关键词 搜索引擎 pagerank google 网络爬行机器人 排序
下载PDF
Google搜索引擎的数学模型及其应用 被引量:6
5
作者 赵国 宋建成 《西南民族大学学报(自然科学版)》 CAS 2010年第3期480-486,共7页
该文在阐明Google搜索引擎中关键的页面等级算法(PageRank)原理的基础上,分析了PageRank算法的随机冲浪模型,并着重讨论相应的数学模型在足球队排名问题(1993年全国大学生数学建模竞赛B题)中的应用.具体做法是综合考虑各队的比赛成绩,... 该文在阐明Google搜索引擎中关键的页面等级算法(PageRank)原理的基础上,分析了PageRank算法的随机冲浪模型,并着重讨论相应的数学模型在足球队排名问题(1993年全国大学生数学建模竞赛B题)中的应用.具体做法是综合考虑各队的比赛成绩,为每支球队计算相应的等级分(Rank),然后根据各队的等级分高低来确定名次.考虑到竞技比赛结果的不确定性,最后建立了等级分的随机冲浪模型.分析表明等级分排名结果具有良好的参数稳定性,并且可以成功地处理数据缺损方面的困难. 展开更多
关键词 搜索引擎 googlepagerank算法 随机冲浪模型 足球队排名问题
下载PDF
Google的排名算法分析 被引量:1
6
作者 陈芸 《景德镇高专学报》 2005年第2期43-44,共2页
介绍了Google的排名算法PageRank的原理及其具体实现,并对未来搜索引擎的排名算法研究进行了展望。
关键词 搜索引擎 pagerank google
下载PDF
PageRank算法研究 被引量:69
7
作者 黄德才 戚华春 《计算机工程》 EI CAS CSCD 北大核心 2006年第4期145-146,162,共3页
深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满... 深入剖析了著名搜索引擎Google的关键技术PageRank算法,介绍分析了该算法的当前发展现状。并针对PageRank算法容易出现主题漂移现象,利用提出的二阶相似度改进算法。实验表明,改进的算法有利于减少主题漂移现象,提高用户对检索结果的满意度。 展开更多
关键词 pagerank 搜索引擎 排序算法 google
下载PDF
PageRank技术分析与搜索引擎检索效率研究
8
作者 杨海东 张莉 《淮阴师范学院学报(自然科学版)》 CAS 2003年第3期230-233,共4页
通过对Google的Pagerank算法的分析,对当前互联网搜索引擎的检索效率的改进与提高提出了自己的看法.
关键词 google pagerank 搜索引擎 检索效率
下载PDF
PageRank算法的分析及其改进 被引量:43
9
作者 王德广 周志刚 梁旭 《计算机工程》 CAS CSCD 北大核心 2010年第22期291-292,F0003,共3页
在分析PageRank算法存在偏重旧网页、主题漂移、网页权值均分、忽视用户浏览兴趣现象的基础上,对其进行改进,考虑网页修改日期、网页文本信息、网站权威度、用户兴趣度等重要因素,重新计算网页PR值。实验结果表明,改进算法可提高搜索引... 在分析PageRank算法存在偏重旧网页、主题漂移、网页权值均分、忽视用户浏览兴趣现象的基础上,对其进行改进,考虑网页修改日期、网页文本信息、网站权威度、用户兴趣度等重要因素,重新计算网页PR值。实验结果表明,改进算法可提高搜索引擎对网页排序的准确度,以及用户对检索结果的满意度。 展开更多
关键词 pagerank算法 搜索引擎 文本数据挖掘 PR值
下载PDF
基于MapReduce的并行PageRank算法实现 被引量:12
10
作者 平宇 向阳 +1 位作者 张波 黄寅飞 《计算机工程》 CAS CSCD 2014年第2期31-34,38,共5页
分布式网络爬虫的广泛应用使得搜索引擎的数据规模呈几何式增长,面对数以TB甚至PB量级的数据,单机模式下的PageRank算法由于CPU、I/O和内存的开销过大导致效率低下。为此,提出一种基于MapReduce框架的并行PageRank算法。在算法的一次迭... 分布式网络爬虫的广泛应用使得搜索引擎的数据规模呈几何式增长,面对数以TB甚至PB量级的数据,单机模式下的PageRank算法由于CPU、I/O和内存的开销过大导致效率低下。为此,提出一种基于MapReduce框架的并行PageRank算法。在算法的一次迭代过程中,利用Map函数对网页拓扑信息文件进行解析,使用Reduce函数计算网页得分,从而并行化PageRank算法的中间迭代过程。通过计算全局网页得分控制迭代次数,得到较精确的网页排序结果。实验结果表明,该算法在保持原有单机PageRank算法整体网页排序精度的基础上,具有较好的集群性能和较快的执行速度。 展开更多
关键词 搜索引擎 pagerank算法 MAPREDUCE框架 并行计算 HADOOP平台
下载PDF
基于PageRank的页面排序改进算法 被引量:11
11
作者 王冬 雷景生 李壮 《计算机工程与设计》 CSCD 北大核心 2008年第22期5921-5923,F0003,共4页
首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法。在此基础上,指出PageRank算法给不同网页分配相同的PageRank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行... 首先对PageRank算法进行了一般性介绍,研究了现有的基于链接结构的改进算法。在此基础上,指出PageRank算法给不同网页分配相同的PageRank值影响了网页的排序质量,提出了一种基于多层分类技术的改进算法HCPR,并对PageRank和HCPR算法进行了相应测试和比较。实验结果表明,HCPR的排序结果比PageRank提高了约15.3%的相关度。 展开更多
关键词 搜索引擎 信息检索 排序算法 数据挖掘 页面等级
下载PDF
一种基于PageRank的页面排序改进算法 被引量:18
12
作者 王冬 雷景生 《微电子学与计算机》 CSCD 北大核心 2009年第4期210-213,共4页
首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NP... 首先对PageRank算法进行了分析,探讨了国外现有的基于链接结构的改进算法.在此基础上,指出PageRank算法平均分配PageRank值影响了网页的排序质量,提出了一种不平均分配PageRank值的改进算法NPR,并对改进算法进行测试及分析.实验证明,NPR的排序结果比PageRank提高了约11.2%的相关度. 展开更多
关键词 搜索引擎 信息检索 排序算法 数据挖掘 pagerank
下载PDF
搜索引擎PageRank算法研究 被引量:12
13
作者 蔡建超 蔡明 《计算机应用与软件》 CSCD 北大核心 2008年第9期59-60,82,共3页
在研究搜索引擎关键技术的基础上,深入细致地剖析了著名搜索引擎Google的链接分析排名算法PageRank算法,解说其运行原理并给出改进算法。在此基础上指出PageRank算法存在的缺陷,从而针对性地提出了优化方案,实验结果表明,改进的算法有... 在研究搜索引擎关键技术的基础上,深入细致地剖析了著名搜索引擎Google的链接分析排名算法PageRank算法,解说其运行原理并给出改进算法。在此基础上指出PageRank算法存在的缺陷,从而针对性地提出了优化方案,实验结果表明,改进的算法有利于提高算法的运行效率,提高用户对检索结果的查准率。 展开更多
关键词 搜索引擎 排名算法 pagerank
下载PDF
提高PageRank算法效率的方法初探 被引量:3
14
作者 刘悦 程学旗 李国杰 《计算机科学》 CSCD 北大核心 2002年第6期55-56,共2页
1.引言 Web是人类历史上承载数据最丰富的信息库,但在Web上查找所需要的信息却很困难,由于Web的海量规模、异构、动态等特性,使得Web文本检索表现出更大的挑战性,广泛地引起了各方面的研究兴趣.该领域当前的流派大体可以分为:经典IR流派... 1.引言 Web是人类历史上承载数据最丰富的信息库,但在Web上查找所需要的信息却很困难,由于Web的海量规模、异构、动态等特性,使得Web文本检索表现出更大的挑战性,广泛地引起了各方面的研究兴趣.该领域当前的流派大体可以分为:经典IR流派,METADATA流派,数据库流派和链接分析流派. 展开更多
关键词 pagerank算法 效率 搜索引警 计算机网络 页面质量评价算法
下载PDF
Nutch中PageRank的并行实现 被引量:4
15
作者 梁正友 潘涛 《计算机工程与设计》 CSCD 北大核心 2010年第20期4354-4356,4409,共4页
针对目前Nutch搜索引擎中没有实现PageRank计算的缺憾,在分析和研究经典PageRank算法的基础上,通过设置控制站外与站内链接的比重因子对该算法进行了改进。利用MapReduce处理大数据集的优势,在Nutch机群系统上设计并实现了基于MapReduce... 针对目前Nutch搜索引擎中没有实现PageRank计算的缺憾,在分析和研究经典PageRank算法的基础上,通过设置控制站外与站内链接的比重因子对该算法进行了改进。利用MapReduce处理大数据集的优势,在Nutch机群系统上设计并实现了基于MapReduce的PageRank分布式并行算法。实验结果表明,处理的数据量越大,机群中的节点越多,计算PageRank的效率越高;另外,该分布式并行算法具有较好的可扩展性。 展开更多
关键词 Nutch搜索引擎 pagerank算法 MAPREDUCE模型 机群 并行计算
下载PDF
PageRank算法权威值均分的改进 被引量:3
16
作者 李瑞 郭小溪 《大连交通大学学报》 CAS 2013年第2期109-112,共4页
在分析PageRank算法模型基础上,针对该算法存在的对所链接页面平均分配权威值问题进行了说明,并分析了部分国内外学者的改进思想,提出了笔者的改进算法.在原算法基础上通过嵌入页面转移概率,保证了权威值的合理分配,实验结果表明,改进... 在分析PageRank算法模型基础上,针对该算法存在的对所链接页面平均分配权威值问题进行了说明,并分析了部分国内外学者的改进思想,提出了笔者的改进算法.在原算法基础上通过嵌入页面转移概率,保证了权威值的合理分配,实验结果表明,改进的算法提高了网页排序的精确度. 展开更多
关键词 搜索引擎 pagerank算法 随机访问 转移概率
下载PDF
基于PageRank的Web挖掘改进算法 被引量:10
17
作者 焦金涛 《计算机工程》 CAS CSCD 北大核心 2009年第15期284-284,F0003,共2页
针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高... 针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高网页重要性判断的准确度。 展开更多
关键词 搜索引擎 网页 pagerank算法
下载PDF
基于用户兴趣度的PageRank改进算法 被引量:3
18
作者 黄贤英 陈红阳 《重庆理工大学学报(自然科学)》 CAS 2014年第5期74-78,共5页
传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题。针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法。该算法主要从网页自身的客观特性和用户兴趣的主观... 传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题。针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法。该算法主要从网页自身的客观特性和用户兴趣的主观特性两方面对网页的PR值进行重新估算,并依据估算后的网页PR值对网页做重排序。相比传统的PageRank算法,改进的PRUI算法进一步提高了系统检索的准确率和首页命中率。 展开更多
关键词 搜索引擎 pagerank算法 主题漂移 用户兴趣度 页面排序
下载PDF
融合VSM技术的PageRank算法研究与应用 被引量:4
19
作者 李卫东 陆玲 《计算机与现代化》 2011年第7期96-98,101,104,共5页
为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数... 为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。 展开更多
关键词 pagerank算法 链接分析 向量空间模型 搜索引擎
下载PDF
基于用户反馈的PageRank改进算法 被引量:6
20
作者 方树峰 《计算技术与自动化》 2012年第1期89-92,共4页
通过分析PageRank算法存在的偏重旧网页问题、主题偏移问题及网页欺骗问题,提出一种基于用户反馈的PageRank改进算法,该算法在原算法的基础上添加用户点击次数反馈和点击时间反馈及反馈权重,并结合基于网页内容的排序算法思想,加入网页... 通过分析PageRank算法存在的偏重旧网页问题、主题偏移问题及网页欺骗问题,提出一种基于用户反馈的PageRank改进算法,该算法在原算法的基础上添加用户点击次数反馈和点击时间反馈及反馈权重,并结合基于网页内容的排序算法思想,加入网页内容权重,对PR值的计算公式进行改进,从而克服PageRank算法中存在的问题。 展开更多
关键词 pagerank 排序算法 搜索引擎
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部