期刊文献+
共找到187篇文章
< 1 2 10 >
每页显示 20 50 100
Ranking of Web Pages in a Personalized Search
1
作者 Mahmoud Abou Ghaly 《Journal of Computer and Communications》 2023年第2期89-101,共13页
The basic idea behind a personalized web search is to deliver search results that are tailored to meet user needs, which is one of the growing concepts in web technologies. The personalized web search presented in thi... The basic idea behind a personalized web search is to deliver search results that are tailored to meet user needs, which is one of the growing concepts in web technologies. The personalized web search presented in this paper is based on exploiting the implicit feedbacks of user satisfaction during her web browsing history to construct a user profile storing the web pages the user is highly interested in. A weight is assigned to each page stored in the user’s profile;this weight reflects the user’s interest in this page. We name this weight the relative rank of the page, since it depends on the user issuing the query. Therefore, the ranking algorithm provided in this paper is based on the principle that;the rank assigned to a page is the addition of two rank values R_rank and A_rank. A_rank is an absolute rank, since it is fixed for all users issuing the same query, it only depends on the link structures of the web and on the keywords of the query. Thus, it could be calculated by the PageRank algorithm suggested by Brin and Page in 1998 and used by the google search engine. While, R_rank is the relative rank, it is calculated by the methods given in this paper which depends mainly on recording implicit measures of user satisfaction during her previous browsing history. 展开更多
关键词 Implicit Feedback Personalized search Web page Ranking User Profile
下载PDF
对网页PageRank算法的改进 被引量:40
2
作者 宋聚平 王永成 +1 位作者 尹中航 滕伟 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第3期397-400,共4页
分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信... 分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信息 ,在 href、title等标记中文字对网页主题有重要作用 ,利用结构标记可以辅助判断网页的主题内容 .试验结果表明 。 展开更多
关键词 搜索引擎 网页 超链分析 pageRANK
下载PDF
基于内容相关性和时间分析的改进PageRank算法 被引量:7
3
作者 邓丹君 周彩兰 《计算机与数字工程》 2011年第1期25-27,共3页
传统PageRank算法仅仅通过网页链接结构来确定网页的PageRank值,这通常会导致主题漂移问题,即主题内容不相关的网页PageRank值较高。改进的PageRank算法根据链接的网页之间的内容相关性分配rank值,并且将网页的时间因素考虑在内,提高新... 传统PageRank算法仅仅通过网页链接结构来确定网页的PageRank值,这通常会导致主题漂移问题,即主题内容不相关的网页PageRank值较高。改进的PageRank算法根据链接的网页之间的内容相关性分配rank值,并且将网页的时间因素考虑在内,提高新的内容相关网页的rank值。实验结果证明,改进后的算法有效解决原算法的主题漂移问题,并使新网页在排序结果中上升。 展开更多
关键词 内容相关 时间分析 页面排序 搜索引擎
下载PDF
基于PageRank的Web挖掘改进算法 被引量:10
4
作者 焦金涛 《计算机工程》 CAS CSCD 北大核心 2009年第15期284-284,F0003,共2页
针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高... 针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高网页重要性判断的准确度。 展开更多
关键词 搜索引擎 网页 pageRANK算法
下载PDF
PageRank算法中主题漂移的研究 被引量:13
5
作者 高琪 张永平 《微计算机信息》 2010年第9期117-119,89,共4页
pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂... pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页。也正因此在使用pagerank算法时往往会发生主题漂移现象。产生这一问题的原因有两个,一是pagerank对网页权值平均分配,二是pagerank与查询主题的无关性。本文从这二方面入手,采用tf-idf算法计算主题的相关权重,提出了与查询主题相关的query-basedpagerank算法,有效地解决了原算法中的主题漂移问题。 展开更多
关键词 pageRANK 主题漂移 主题敏感 页面排序 搜索引擎
下载PDF
基于网页分块的Shark-Search算法 被引量:7
6
作者 陈军 陈竹敏 《山东大学学报(理学版)》 CAS CSCD 北大核心 2007年第9期62-66,共5页
Shark-Search算法是一个经典的主题爬取算法.针对该算法在爬取噪音链接较多的Web页面时性能并不理想的问题,提出了基于网页分块的Shark-Search算法,该算法从页面、块、链接的多种粒度来更加有效的进行链接的选择与过滤.实验证明,改进的S... Shark-Search算法是一个经典的主题爬取算法.针对该算法在爬取噪音链接较多的Web页面时性能并不理想的问题,提出了基于网页分块的Shark-Search算法,该算法从页面、块、链接的多种粒度来更加有效的进行链接的选择与过滤.实验证明,改进的Shark-Search算法比传统的Shark-Search算法在查准率和信息量总和上有了质的提高. 展开更多
关键词 Shark-search算法 主题爬取 页面分块 相关性计算
下载PDF
一种基于空间向量模型的主题PageRank算法 被引量:1
7
作者 张冉 夏素萍 《电脑知识与技术》 2009年第2期883-885,共3页
该文基于传统的PageRank链接分析原理,分析了PageRank在页面主题内容分析方面的不足之处,结合传统的基于内容的VSM文本分析模型.提出了一种基于向量空间模型的主题算法,并通过实验对改算法的性能进行分析。
关键词 pageRANK VSM 网页排序 搜索引擎
下载PDF
改进的Shark-search算法在网络采集中的应用 被引量:1
8
作者 张玲 祁玉娟 姜华 《计算机技术与发展》 2017年第8期192-194,199,共4页
Shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研... Shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研究,提出了一种基于网页主题分块的Shark-search算法。该算法在经典Shark-search算法的基础上依据网页组织结构根据网页布局标签对页面内容进行分块,从网页,块和链接三个层面与主题的相关性得到链接的综合价值,因而具有自学习功能,能统计学习与主题相关性较大的块特征,并在发生主题漂移的时候具有自调整功能,给予主题相关性较大的父页面上的链接更多被抓取的机会。采集实验结果表明,所提出的算法在经典Shark-search的基础上能较好地改进主题信息采集的查准率,能够更灵活地针对实际的Web资源状况进行自调整。 展开更多
关键词 Shark-search算法 网页分块 Web信息搜集 链接价值 主题漂移
下载PDF
中文搜索引擎中的PageRank算法及实现 被引量:3
9
作者 琚洁慧 《计算机工程与设计》 CSCD 北大核心 2007年第7期1632-1635,共4页
由于网页质量千差万别,对网页进行基于网络链接图的质量排序变成了现代搜索引擎的一个重要部件。分析了对网络排序模块的实现进行优化时,造成大规模稀疏矩阵-向量乘法运算低效的原因,并结合网络链接图的实际情况提出了几种不同的优化策... 由于网页质量千差万别,对网页进行基于网络链接图的质量排序变成了现代搜索引擎的一个重要部件。分析了对网络排序模块的实现进行优化时,造成大规模稀疏矩阵-向量乘法运算低效的原因,并结合网络链接图的实际情况提出了几种不同的优化策略。然后,对几种优化策略做了实验性能比较,并综合考虑各种优化策略的运算效率和存储量需求,选择了适合实际系统的优化策略。同时,提出PageRank算法在实现时的一个变通处理——除汇。 展开更多
关键词 搜索引擎 网页排序 网络链接图 稀疏矩阵 汇点
下载PDF
基于用户兴趣度的PageRank改进算法 被引量:3
10
作者 黄贤英 陈红阳 《重庆理工大学学报(自然科学)》 CAS 2014年第5期74-78,共5页
传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题。针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法。该算法主要从网页自身的客观特性和用户兴趣的主观... 传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题。针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法。该算法主要从网页自身的客观特性和用户兴趣的主观特性两方面对网页的PR值进行重新估算,并依据估算后的网页PR值对网页做重排序。相比传统的PageRank算法,改进的PRUI算法进一步提高了系统检索的准确率和首页命中率。 展开更多
关键词 搜索引擎 pageRANK算法 主题漂移 用户兴趣度 页面排序
下载PDF
基于改进PageRank算法的管道专业搜索引擎系统设计与实现
11
作者 王兵 许少华 张兴旺 《大庆石油学院学报》 CAS 北大核心 2007年第1期79-81,87,共4页
针对管道科技工作人员进行大量专业化信息检索的业务需要,在系统分析和研究专业搜索引擎实现技术的基础上,采用多线程编程技术,设计开发基于PageRank改进算法的管道专业搜索引擎系统.根据管道信息业务流程,设计了系统的组成架构,探讨超... 针对管道科技工作人员进行大量专业化信息检索的业务需要,在系统分析和研究专业搜索引擎实现技术的基础上,采用多线程编程技术,设计开发基于PageRank改进算法的管道专业搜索引擎系统.根据管道信息业务流程,设计了系统的组成架构,探讨超链分析、搜索策略、网页评级排序等关键技术.管道专业搜索引擎系统采用VC++6.0开发,其原型系统在实际应用中表现出良好的适应性. 展开更多
关键词 管道 专业搜索引擎 超链分析 搜索策略 网页评级
下载PDF
PageRank算法的并行实现 被引量:1
12
作者 闫建红 《太原师范学院学报(自然科学版)》 2014年第2期53-57,78,共6页
针对当前大数据时代的背景,信息数据的海量化现象与日俱增,为了实现数据搜索的低成本、高效率,对Google搜索引擎的PageRank算法进行了综合性的研究分析,分别介绍了MapReduce框架和Hadoop实现平台,在此基础上,在Hadoop平台详细分析了基于... 针对当前大数据时代的背景,信息数据的海量化现象与日俱增,为了实现数据搜索的低成本、高效率,对Google搜索引擎的PageRank算法进行了综合性的研究分析,分别介绍了MapReduce框架和Hadoop实现平台,在此基础上,在Hadoop平台详细分析了基于MapReduce的PageRank算法的并行实现过程,以实现海量数据的并行处理,极大地提高了搜索引擎的性能. 展开更多
关键词 搜索引擎 pageRANK 并行实现 HADOOP MAPREDUCE
下载PDF
改进PageRank算法的网页权重分析 被引量:1
13
作者 黄艳 李朝荣 《宜宾学院学报》 2022年第6期6-8,41,共4页
PageRank算法用离线方式分析网页之间的链接计算网页权重,具有响应速度快等特点,但未考虑环境和主题相关等因素的影响.对此,提出采用网页点击率和时间因素,结合网页的重要性来计算网页的权重.模拟实验和分析表明,改进的算法能够根据网... PageRank算法用离线方式分析网页之间的链接计算网页权重,具有响应速度快等特点,但未考虑环境和主题相关等因素的影响.对此,提出采用网页点击率和时间因素,结合网页的重要性来计算网页的权重.模拟实验和分析表明,改进的算法能够根据网页的点击率和存在时间动态调整网页排序结果,比原始的PageRank算法产生的排序更加合理. 展开更多
关键词 pageRANK算法 网页排序 搜索引擎
下载PDF
PageRank算法的研究与改进 被引量:3
14
作者 李青淋 邵家玉 《工业控制计算机》 2016年第5期117-118,共2页
页面排序算法是搜索引擎的核心之一。通过分析传统PageRank算法可知该算法主要是依据页面之间的链接关系,容易出现偏重旧网页、主题偏移等不足之处。为了提高网页排序算法的准确率,结合网页内容相关性因子和网页更新时间因子,提出一种... 页面排序算法是搜索引擎的核心之一。通过分析传统PageRank算法可知该算法主要是依据页面之间的链接关系,容易出现偏重旧网页、主题偏移等不足之处。为了提高网页排序算法的准确率,结合网页内容相关性因子和网页更新时间因子,提出一种改进的PageRank算法。实验结果表明,改进后的PageRank算法提高了搜索的查全率与查准率,提高了网页排序的质量。 展开更多
关键词 页面排序 pageRANK 搜索引擎 内容相关 时间因子
下载PDF
Evaluation of the Importance of Web Pages
15
作者 宋聚平 Wang +4 位作者 Yongcheng YIN Zhonghang Zeng Yuming 《High Technology Letters》 EI CAS 2001年第4期23-26,共4页
Google’s algorithm on PageRank is analyzed in details. Some disadvantages of this algorithm is presented, for instance, preferring old pages, ignoring special sites and inaccurate judge of hyperlinks pointed out from... Google’s algorithm on PageRank is analyzed in details. Some disadvantages of this algorithm is presented, for instance, preferring old pages, ignoring special sites and inaccurate judge of hyperlinks pointed out from one page. Furthermore, author’s improved algorithm is described. Experiments show that the author’s consideration on evaluating the importance of pages can make an improvement over the original algorithm. Based on this improved algorithm a topic specific searching system have been developed. 展开更多
关键词 search engine Authority of pages pageRANK Hyperlink analysis
下载PDF
主题爬虫的搜索策略研究 被引量:26
16
作者 刘汉兴 刘财兴 《计算机工程与设计》 CSCD 北大核心 2008年第12期3160-3162,3166,共4页
主题爬虫收集主题相关信息时,需要评价网页的主题相关度,并优先爬取相关度较高的网页,在决定了搜索路径的同时也决定了主题爬虫的搜索效率。针对不同的网页评价算法,对现有的主题爬虫的搜索策略进行分类,指出了各类搜索策略的特点和优缺... 主题爬虫收集主题相关信息时,需要评价网页的主题相关度,并优先爬取相关度较高的网页,在决定了搜索路径的同时也决定了主题爬虫的搜索效率。针对不同的网页评价算法,对现有的主题爬虫的搜索策略进行分类,指出了各类搜索策略的特点和优缺点,总结了能够提高主题爬虫搜索效率的几方面内容。 展开更多
关键词 主题爬虫 搜索策略 页面评价 搜索引擎 优化
下载PDF
Web页面视觉搜索与浏览策略的眼动研究 被引量:16
17
作者 栗觅 钟宁 吕胜富 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第5期773-779,共7页
利用眼动跟踪技术,探讨W eb页面视觉搜索和浏览的视觉特征,并分析2种视觉行为对应策略的差异.实验结果发现,视觉搜索时,周边区域的注视时间和注视次数显著大于中心区域;而视觉浏览时,周边区域和中心区域没有显著差异.而且,视觉搜索时的... 利用眼动跟踪技术,探讨W eb页面视觉搜索和浏览的视觉特征,并分析2种视觉行为对应策略的差异.实验结果发现,视觉搜索时,周边区域的注视时间和注视次数显著大于中心区域;而视觉浏览时,周边区域和中心区域没有显著差异.而且,视觉搜索时的瞳孔直径显著大于浏览时的瞳孔直径,说明视觉搜索时的心理负荷显著大于浏览时的心理负荷.结果表明,在W eb页面上视觉搜索呈现周边区域的视觉搜索策略,而对于视觉浏览更多采用无明显规律的自由随机浏览策略.这种视觉搜索与浏览策略的差异主要是来自目标驱动和心理负荷大小的影响. 展开更多
关键词 WEB页面 视觉搜索 视觉浏览 眼动
下载PDF
医学寄生虫网络资料数据库的建立 被引量:5
18
作者 陈自强 贾雍 +1 位作者 彭鸿娟 陈晓光 《第一军医大学学报》 CSCD 北大核心 2003年第1期50-52,共3页
为了建立可用关键词进行资料搜索的医学寄生虫学数据库,本研究应用ASP程序及SQL语言,在网页与数据库文件之间建立了桥梁,利用数据库文件实现了网页搜索功能和资料查询。通过对医学寄生虫资料数据库建立方法的介绍,探讨了一种基于数据库... 为了建立可用关键词进行资料搜索的医学寄生虫学数据库,本研究应用ASP程序及SQL语言,在网页与数据库文件之间建立了桥梁,利用数据库文件实现了网页搜索功能和资料查询。通过对医学寄生虫资料数据库建立方法的介绍,探讨了一种基于数据库的网络搜索的方法。 展开更多
关键词 医学寄生虫网络资料数据库 建立 网络搜索 ASP程序 SQL语言
下载PDF
Web页面信息的视觉搜索行为特征的研究 被引量:9
19
作者 栗觅 钟宁 吕胜富 《计算机科学与探索》 CSCD 2009年第6期649-655,共7页
网页是非常重要的人机界面,网页信息如何有效、合理地布局以引导人们的视觉行为,进而提高视觉搜索效率是网页设计者重点考虑的问题。从认知科学角度研究人们在Web页面上进行设计视觉信息搜索时的视觉行为特性,同时探讨浮动广告对于视觉... 网页是非常重要的人机界面,网页信息如何有效、合理地布局以引导人们的视觉行为,进而提高视觉搜索效率是网页设计者重点考虑的问题。从认知科学角度研究人们在Web页面上进行设计视觉信息搜索时的视觉行为特性,同时探讨浮动广告对于视觉搜索行为的影响。实验结果显示:无论是否有浮动广告,Web页面周边区域的注视时间和注视次数都显著大于中心区域。实验结果表明,Web页面视觉性搜索信息时,更多地注视周边区域,呈现视觉搜索的周边特性;而浮动广告对于视觉搜索行为没有显著影响。实验结果说明:(1)从视觉搜索角度来看,对于具有超级链接性质的标题信息,放置在周边区域比在中心区域更有利于人们的视觉搜索行为;(2)浮动广告的广告效应不明显。 展开更多
关键词 WEB页面 视觉搜索 浮动广告 眼动技术 注视时间 注视次数
下载PDF
高性能网页索引器JU_Indexer的实现 被引量:4
20
作者 赫枫龄 左万利 张雪松 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第1期50-56,共7页
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU_Indexer的系统框架,然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引... 高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU_Indexer的系统框架,然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JU_Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间. 展开更多
关键词 WEB网页 网络搜索引擎 网页索引器
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部