期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
求解PageRank向量的一种松弛多步分裂迭代方法
1
作者 田兆禄 王玉栋 刘仲云 《工程数学学报》 CSCD 北大核心 2024年第4期642-658,共17页
基于求解PageRank向量的内外迭代格式,引入一个松弛因子得到一种松弛内外迭代方法。结合已有的多步分裂迭代框架,引入两个不同的松弛因子,提出了求解PageRank向量的松弛多步分裂迭代方法并分析了算法的收敛性。更进一步地,利用松弛内外... 基于求解PageRank向量的内外迭代格式,引入一个松弛因子得到一种松弛内外迭代方法。结合已有的多步分裂迭代框架,引入两个不同的松弛因子,提出了求解PageRank向量的松弛多步分裂迭代方法并分析了算法的收敛性。更进一步地,利用松弛内外迭代格式构造了加速投影子空间方法的预处理矩阵,理论分析相关谱分布情况,并给出了松弛多步分裂迭代方法及预处理矩阵中参数的选取准则。几个数值例子验证了松弛多步分裂迭代方法和预处理矩阵的有效性,通过选取合适的松弛因子,与多步分裂迭代方法相比具有更高的运算效率。 展开更多
关键词 PageRank向量 多步分裂迭代方法 松弛因子 迭代矩阵 最优参数
下载PDF
专题搜索引擎中信息过滤的研究与实现 被引量:10
2
作者 李世明 赵恒永 李世友 《计算机工程与设计》 CSCD 北大核心 2006年第8期1392-1394,1397,共4页
在对经典信息过滤算法进行研究分析的基础上,结合网页重要性和主题相关性,给出了专题搜索引擎中信息过滤模块的设计思路和实施策略,并在专业词汇、查询扩展和用户反馈等方面对算法进行了改进和拓展。最后给出了系统的实施方案,并对将来... 在对经典信息过滤算法进行研究分析的基础上,结合网页重要性和主题相关性,给出了专题搜索引擎中信息过滤模块的设计思路和实施策略,并在专业词汇、查询扩展和用户反馈等方面对算法进行了改进和拓展。最后给出了系统的实施方案,并对将来的工作做了展望。 展开更多
关键词 搜索引擎 信息过滤 网页级别 向量空间模型
下载PDF
基于海量数据挖掘的个性化推荐系统 被引量:3
3
作者 郭晔 王浩鸣 杨新安 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期899-902,共4页
目的建立海量数据环境中具有个性化的推荐系统。方法在普通文献推荐系统的基础上,增加基于链接页面的Pagerank计算,从而更精确地表示查询页面相对于特定用户的查询价值。结果结合了基于页面内容的查询方法与基于链接的查询方法的优点。... 目的建立海量数据环境中具有个性化的推荐系统。方法在普通文献推荐系统的基础上,增加基于链接页面的Pagerank计算,从而更精确地表示查询页面相对于特定用户的查询价值。结果结合了基于页面内容的查询方法与基于链接的查询方法的优点。结论具有一定的研究价值,值得在未来的研究工作中加以完善。 展开更多
关键词 文档分类 特征提取 向量空间 邻接矩阵 PAGERANK
下载PDF
基于Web的Lucene全文搜索排序算法的研究 被引量:5
4
作者 沙阳阳 吴陈 《计算机与数字工程》 2019年第5期1208-1211,1239,共5页
在计算机与网络技术支撑日趋成熟的情况下,企业内部充斥着大量的电子信息。为了能够满足企业对高效、准确地检索出所需讯息的需求。搜索引擎技术的革新、发展被提上日程,而人们在文本检索中使用的排序算法又是影响搜索引擎质量的一个不... 在计算机与网络技术支撑日趋成熟的情况下,企业内部充斥着大量的电子信息。为了能够满足企业对高效、准确地检索出所需讯息的需求。搜索引擎技术的革新、发展被提上日程,而人们在文本检索中使用的排序算法又是影响搜索引擎质量的一个不可忽略的因素。原始的Lucene搜索引擎使用基于向量模型的排序算法,然而这种原始的算法在自然语义理解上面有很大的弊端。由此论文在剖析Lucene组织结构、文档排序算法以及对比经典排序算法DirectHit、PageRank的基础之上,提出了一种新型的Vector-PageRank排序算法,算法针对基础算法的不足之处进行优化,并在此算法的基础之上设计实现了一款适合企业的搜索引擎系统。实验结果表明,经过优化后的Lucene的排序算法精确度更高,更符合用户的关切度。 展开更多
关键词 Lucene向量空间模型 相似度 vector-pagerank
下载PDF
实时微博谣言的未来传播范围评估方法 被引量:2
5
作者 马晓宁 梁晓菡 《计算机工程与设计》 北大核心 2019年第10期2785-2790,共6页
为找出可能在未来广泛传播的微博谣言,提出将谣言实时识别和谣言传播范围评估相结合的方法。建立实时谣言识别模型,在微博消息发出时刻提取特征进行实时谣言识别;基于改进的用户影响力算法建立谣言传播范围评估模型;按评估周期采用谣言... 为找出可能在未来广泛传播的微博谣言,提出将谣言实时识别和谣言传播范围评估相结合的方法。建立实时谣言识别模型,在微博消息发出时刻提取特征进行实时谣言识别;基于改进的用户影响力算法建立谣言传播范围评估模型;按评估周期采用谣言传播范围评估模型对谣言在发出后的传播范围进行评估。实验结果表明,实时谣言识别方法具有较高的准确率,基于改进的用户影响力算法比基于PageRank算法提出的谣言传播范围评估模型更加合理地预评估了谣言的传播范围,可得到在发布后可能会广泛传播的谣言。 展开更多
关键词 实时谣言识别 用户影响力 消息传播 支持向量机 PAGERANK算法
下载PDF
基于Nutch的页面排序算法研究 被引量:1
6
作者 胡维华 曹奇峰 《杭州电子科技大学学报(自然科学版)》 2013年第6期74-77,共4页
针对某一主题或学科的垂直搜索引擎是搜索引擎的延伸和细分,面向特定用户提供垂直搜索。网页排序算法是搜索引擎好坏的关键,搜索引擎网页排序算法的目的是从海量搜索结果中将主题相关和权威的网页排在前列,帮助用户查找所需的资源。Nutc... 针对某一主题或学科的垂直搜索引擎是搜索引擎的延伸和细分,面向特定用户提供垂直搜索。网页排序算法是搜索引擎好坏的关键,搜索引擎网页排序算法的目的是从海量搜索结果中将主题相关和权威的网页排在前列,帮助用户查找所需的资源。Nutch搜索引擎只实现了一个基本的综合排序模型,为了使Nutch更好地满足专业用户的需求,该文设计一个综合考虑主题相关性和网页权威性的综合排序模型,将主题相关度因子和改进后的PageRank算法因子融入到Nutch网页评分计算公式中。实验表明,改进的排序算法可以提高信息的查准率,具有明显的主题倾向性,在实际应用中发挥作用。 展开更多
关键词 搜索引擎 向量空间模型 页面排序算法 相似性
下载PDF
融合VSM技术的PageRank算法研究与应用 被引量:4
7
作者 李卫东 陆玲 《计算机与现代化》 2011年第7期96-98,101,104,共5页
为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数... 为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。 展开更多
关键词 PAGERANK算法 链接分析 向量空间模型 搜索引擎
下载PDF
基于图模型和多分类器的微博情感倾向性分析 被引量:9
8
作者 黄挺 姬东鸿 《计算机工程》 CAS CSCD 北大核心 2015年第4期171-175,共5页
为研究情感词对情感倾向分析的作用,提高微博情感分析性能,提出一种情感词图模型的方法,利用PageRank算法计算出情感词的褒贬权值,将其作为条件随机场模型的特征,预测具体语言环境下的情感词倾向。结合具体语境下的情感词倾向,利用支持... 为研究情感词对情感倾向分析的作用,提高微博情感分析性能,提出一种情感词图模型的方法,利用PageRank算法计算出情感词的褒贬权值,将其作为条件随机场模型的特征,预测具体语言环境下的情感词倾向。结合具体语境下的情感词倾向,利用支持向量机模型进行微博语料的主客观分类和情感倾向分类。实验结果表明,图模型构造的情感词典增加了具体语境下情感词倾向预测的准确性,具体语境下的情感词倾向预测对主客观分类和情感倾向分类有明显的改善。 展开更多
关键词 图模型 情感词 条件随机场 支持向量机 网页排序算法 倾向性分析
下载PDF
基于图神经网络的专利关键词提取算法研究 被引量:3
9
作者 王玉叶 王玙 《情报理论与实践》 CSSCI 北大核心 2023年第5期202-208,共7页
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词... [目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。 展开更多
关键词 关键词提取 图神经网络 专利 词向量 PAGERANK
下载PDF
PageRank高阶导向量的数学性质及其算法研究 被引量:1
10
作者 于庆 黄迎富 《徐州师范大学学报(自然科学版)》 CAS 2012年第1期36-40,共5页
提出了求解PageRank高阶导向量的两种新算法.讨论了PageRank问题系数矩阵的一些数学性质,并从理论上分析了两个公式求解PageRank高阶导向量的优劣.数值实验表明了新算法的数值性态.
关键词 GOOGLE PAGERANK 导向量 阻尼因子
下载PDF
改进的非平均传递权值PageRank算法 被引量:9
11
作者 王春花 朱俊平 《计算机工程与设计》 CSCD 北大核心 2010年第10期2231-2233,2237,共4页
为了有效提高搜索引擎对搜索结果排序的精确性,通过对传统PageRank算法分析,针对父页面平均传递页面权值给它所链接子页面及只考虑其直接链接页面的不足,提出基于深2度页面链接与内容和主题相关性分析的一种父页面非平均传递权值的PageR... 为了有效提高搜索引擎对搜索结果排序的精确性,通过对传统PageRank算法分析,针对父页面平均传递页面权值给它所链接子页面及只考虑其直接链接页面的不足,提出基于深2度页面链接与内容和主题相关性分析的一种父页面非平均传递权值的PageRank算法。该算法有效地解决了搜索引擎对排序结果的权威性要求和相关性要求,使搜索结果排序更符合不同网页浏览者的需求,同时也为进一步扩展PageRank算法提供了新的空间。实验结果表明,改进后的算法可以获得优于传统算法搜索精确度。 展开更多
关键词 PAGERANK 深2度 词频向量 位置权重因子 相关度 重要性贡献向量
下载PDF
基于向量空间模型的个性化网页搜索算法研究 被引量:1
12
作者 卢洋 石元博 《辽宁石油化工大学学报》 CAS 2021年第2期92-96,共5页
为解决信息检索时不同用户对搜索结果有不同期望的问题,提出了一种基于向量空间模型的个性化网页搜索算法。针对用户不同兴趣,利用用户画像能够更加全面地表示用户兴趣的特点,通过向量空间模型建立用户画像来表达用户兴趣,结合传统的网... 为解决信息检索时不同用户对搜索结果有不同期望的问题,提出了一种基于向量空间模型的个性化网页搜索算法。针对用户不同兴趣,利用用户画像能够更加全面地表示用户兴趣的特点,通过向量空间模型建立用户画像来表达用户兴趣,结合传统的网页排序算法得出最终的网页排序结果。对于不同用户可得到不同的网页搜索结果,排序靠前的网页中符合用户兴趣的网页数量增多。通过对模拟网页搜索实验结果的分析,证明所提算法较传统PageRank算法在个性化网页搜索方面有所提高。 展开更多
关键词 信息检索 向量空间模型 个性化网页搜索 用户画像 PAGERANK算法
下载PDF
基于相关性时间会议因素的STVRank算法
13
作者 王严鑫 张芳 《计算机与数字工程》 2020年第10期2338-2342,2358,共6页
如何客观、公正、有效地评价科学文献是文献计量学中长期存在的挑战。传统的PageRank算法在评估科学文献的时候将所有引用视为同等重要,没有考虑到引用关系的多种因素,比如说不同主题间的相关性,时间间隔以及会议影响力等。论文考虑这... 如何客观、公正、有效地评价科学文献是文献计量学中长期存在的挑战。传统的PageRank算法在评估科学文献的时候将所有引用视为同等重要,没有考虑到引用关系的多种因素,比如说不同主题间的相关性,时间间隔以及会议影响力等。论文考虑这三种因素对引文网络链接的影响,为它们分配了一定的权重,并结合PageRank算法模型,提出了STVRank算法。该算法通过词向量技术对存在引用关系的科学文献的相关性进行定量分析。真实数据集ANN上的实验验证表明STVRank算法与PageRank,WC,SPRank等排序算法相比,可以提高整个引文网络排名的有效性和稳定性。 展开更多
关键词 引文分析 文献计量 PAGERANK算法 词向量
下载PDF
基于超链接结构和向量空间模型的网页排序算法研究
14
作者 杜光芹 张化祥 《信息技术与信息化》 2006年第4期106-108,共3页
在传统的向量空间模型中,TF—IDF算法被广泛应用在基于关键字的信息检索中,而随着对web检索研究的不断深入,充分利用Web文档结构的超链接信息对提高web检索的查全率和查准率有重要作用,因而本文对这两方面算法的结合进行了研究,并对其... 在传统的向量空间模型中,TF—IDF算法被广泛应用在基于关键字的信息检索中,而随着对web检索研究的不断深入,充分利用Web文档结构的超链接信息对提高web检索的查全率和查准率有重要作用,因而本文对这两方面算法的结合进行了研究,并对其改进进行了讨论。 展开更多
关键词 向量空间模型 超链接 PAGERANK HITS
下载PDF
基于阻尼系数和个性化向量修正的排序模型
15
作者 郑华 蓝屹湘 《韶关学院学报》 2019年第12期1-4,共4页
基于非负矩阵的特征值理论,研究了Google搜索模型中阻尼系数和个性化向量对PageRank排序结果的影响,建立了两个相应的排序模型,并通过数值例子验证所得到的结果.
关键词 GOOGLE搜索 PAGERANK 阻尼系数 个性化向量
下载PDF
基于特殊主题的PageRank改进算法 被引量:1
16
作者 王建雄 《图书情报工作》 CSSCI 北大核心 2012年第21期114-118,共5页
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的... 在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为。改进算法弥补了原算法的不足,提高了主题搜索的效率。 展开更多
关键词 主题漂移 PAGERANK算法 领域向量 锚文本
原文传递
基于PageRank值的文本相似度改进模型 被引量:1
17
作者 熊才权 田浩 《网络安全技术与应用》 2010年第6期55-57,共3页
相似度计算的质量对于搜索引擎的速度和准确率有着很大的影响。本文提出了基于PageRank值的文本相似度改进模型(BPVSM),以PageRank值对文本分类,在计算文本相似度时考虑不同类别的信息差异。对1370条信息进行检索,用改进后的模型对检索... 相似度计算的质量对于搜索引擎的速度和准确率有着很大的影响。本文提出了基于PageRank值的文本相似度改进模型(BPVSM),以PageRank值对文本分类,在计算文本相似度时考虑不同类别的信息差异。对1370条信息进行检索,用改进后的模型对检索结果进行重排序。实验表明,改进后的模型可以提高检索的准确率。 展开更多
关键词 搜索引擎 PAGERANK 向量空间模型 TF/IDF
原文传递
垂直搜索引擎中信息过滤技术的研究 被引量:3
18
作者 王春艳 李玉福 《情报科学》 CSSCI 北大核心 2014年第3期93-97,共5页
本文在详细分析垂直搜索引擎中的信息过滤技术的基础上,针对易发生主题漂移及存在的时效性问题,对PageRank算法进行改进。并提出了面向机械信息的垂直搜索引擎中的信息过滤模式,能够有效地抓取机械领域的相关信息,增强了搜索主题的针对性。
关键词 垂直搜索引擎 信息过滤 PAGERANK算法 向量空间模型
原文传递
基于句中词语间关系的文本向量化算法 被引量:4
19
作者 许阳 刘功申 孟魁 《信息安全与通信保密》 2014年第4期84-88,共5页
文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传... 文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。 展开更多
关键词 向量模型 文本表示 PAGERANK 词语关系
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部