期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于网页链接与用户反馈的PageRank算法改进研究 被引量:13
1
作者 曹姗姗 王冲 《计算机科学》 CSCD 北大核心 2014年第12期179-182,共4页
在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角... 在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角度共同对网页PR值进行合理分配,以在一定程度上达到高质量网页尽量排序靠前、信息价值低的网页尽量下沉的目的。仿真实验表明,BPR算法在一定程度上改善了排序效果,提升了用户信息检索满意度。 展开更多
关键词 网页排序 结构 用户反馈 PAGERANK 算法改进
下载PDF
基于用户反馈与链接关系的网页排序改进算法 被引量:7
2
作者 王冲 纪仙慧 《计算机工程与设计》 北大核心 2016年第5期1166-1170,1223,共6页
为改善传统PageRank算法存在主题漂移、网页欺诈、偏向旧网页等不足,提出一种基于用户反馈与链接关系的网页排序改进算法FLPR。通过分析两网页各自链出页面的共同页面,衡量网页内容的相关程度,设计内容相关度因子;融合页面停留时间和链... 为改善传统PageRank算法存在主题漂移、网页欺诈、偏向旧网页等不足,提出一种基于用户反馈与链接关系的网页排序改进算法FLPR。通过分析两网页各自链出页面的共同页面,衡量网页内容的相关程度,设计内容相关度因子;融合页面停留时间和链接点击量,设计可信度因子;添加时间相关因子,共同对PR值进行修正调整。仿真结果表明,相较传统PageRank算法和WPR算法,改进后的算法在网页排序质量、查准率以及用户满意度等方面性能均有一定程度提升。 展开更多
关键词 网页排序 关系 内容相关度 用户反馈 算法改进
下载PDF
互联网音视频主动搜索算法效率提高的研究
3
作者 姚瑞虹 张鹏洲 陈志国 《广播与电视技术》 2013年第10期63-67,共5页
随着互联网技术的发展,快速查找并获得所需要的信息己成为人们最迫切的需求。在本文中,为了提高互联网音视频主动搜索算法效率,利用主题搜索引擎技术,在音视频网页识别算法以及音视频网页链接过滤算法上进行研究,以期提高互联网音视频... 随着互联网技术的发展,快速查找并获得所需要的信息己成为人们最迫切的需求。在本文中,为了提高互联网音视频主动搜索算法效率,利用主题搜索引擎技术,在音视频网页识别算法以及音视频网页链接过滤算法上进行研究,以期提高互联网音视频主动搜索的准确率和效率。 展开更多
关键词 主动搜索引擎 主题爬虫 音视频网页识别算法 音视频网页链接过滤算法
下载PDF
一种改进的基于网页主题链接的PageRank算法研究 被引量:1
4
作者 杨泳丹 《科技通报》 2019年第7期178-181,185,共5页
针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均... 针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均值作为权值。本文的PageRank-I算法将网页之间的链接作为链接的向量,以这种链接的关系来对向量的余弦相似度进行主题相关性的描述,而不用对额外的文本信息进行处理,减少了系统负担。实验结果证实本文的PageRank-I算法在没有增加系统的额外负担的同时,也没有增加时间上的复杂度,解决了PageRank算法中主题漂移的问题。 展开更多
关键词 网页主题 相似度 PAGERANK算法 传递权值
下载PDF
基于网页链接分析的电力系统连锁故障关键环节辨识方法 被引量:9
5
作者 柳璐 李林芝 +1 位作者 卢天琪 吴浩 《电力系统自动化》 EI CSCD 北大核心 2021年第10期25-33,共9页
辨识电力系统关键环节,对于分析连锁故障传播规律、制定预防决策措施和提高电网可靠性具有重要意义。文中将网页链接分析的SALSA算法引入电力系统连锁故障的关键环节分析,定义了传播线路和脆弱线路的概念,并基于大量连锁故障的仿真数据... 辨识电力系统关键环节,对于分析连锁故障传播规律、制定预防决策措施和提高电网可靠性具有重要意义。文中将网页链接分析的SALSA算法引入电力系统连锁故障的关键环节分析,定义了传播线路和脆弱线路的概念,并基于大量连锁故障的仿真数据,辨识线路在故障传播中的作用,以及会造成严重大停电后果的高风险故障传播关系。IEEE 39节点系统和某省实际电网的算例验证了所提方法可有效辨识系统关键环节,且针对关键环节的缓解措施能有效降低连锁故障大停电风险。 展开更多
关键词 连锁故障 网页分析算法 关键线路 故障传播关系 大停电
下载PDF
一种利用链接信息检索关键资源的算法 被引量:2
6
作者 顾健 黄萱菁 吴立德 《计算机科学》 CSCD 北大核心 2004年第10期189-192,共4页
随着互联网的发展,基于Web的信息处理技术越来越受到人们的重视,也是当前研究的前沿课题。本文探讨的是如何在现有检索技术的基础上,利用Web网页的链接信息,自动地得到更高质量的检索结果——关键资源。本文提出一种同时利用Web网页的... 随着互联网的发展,基于Web的信息处理技术越来越受到人们的重视,也是当前研究的前沿课题。本文探讨的是如何在现有检索技术的基础上,利用Web网页的链接信息,自动地得到更高质量的检索结果——关键资源。本文提出一种同时利用Web网页的结构和内容信息以及链接信息的新方法:先结合同页的结构信息和内容评分得到网页的文档评分,然后基于网页出链的文档评分计算网页的链接评分。实验表明,本文的方法减少了无用链接的干扰,比单纯利用链接信息的效果好得多。 展开更多
关键词 文档 WEB网页 基于WEB 结构信息 算法 信息检索 检索结果 检索技术 前沿课题
下载PDF
基于链接关系分析的PgaeRank改进算法研究
7
作者 赵鑫 《电脑编程技巧与维护》 2014年第12期26-27,共2页
经典的PageRank算法对所有出链网页采用平均分配链出权值的策略,这种方式会导致网页PR值计算的不准确性。通过对链出网页的重要性进行分析,优化链出权值的分配策略,实验结果表明,改进的PageRank算法使得页面排序的结果更加优化。
关键词 PAGERANK算法 分析 目标网页反向分析
下载PDF
基于LBS的信息搜索系统和链接算法模型的设计
8
作者 王一同 《数字技术与应用》 2014年第8期131-132,共2页
本文介绍了LBS的概念,简述了与本文相关的LBS系统功能模块的技术实现方法。设计了基于LBS功能的信息搜索系统模型和检索信息过滤、索引排序的链接算法模型。
关键词 LBS系统 信息搜索 PAGERANK 算法模型 网页排序
下载PDF
主题相似度与链接权重相结合的垃圾网页排序检测 被引量:2
9
作者 韦莎 朱焱 《计算机应用》 CSCD 北大核心 2016年第3期735-739,共5页
针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权重相结合,共同调节网页非信任值传播的排序算法,即主题链接非信任排序(TLDR)。首先,运用隐含狄利克雷分... 针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权重相结合,共同调节网页非信任值传播的排序算法,即主题链接非信任排序(TLDR)。首先,运用隐含狄利克雷分配(LDA)模型得到所有网页的主题分布,并计算相互链接网页间的主题相似度;其次,根据Web图计算链接权重,并与主题相似度结合,得到主题链接权重矩阵;然后,利用主题链接权重调节非信任值传播,改进Anti-TrustRank和加权非信任值排序(WATR)算法,使网页得到更合理的非信任值;最后,将所有网页的非信任值进行排序,通过划分阈值检测出垃圾网页。在数据集WEBSPAM-UK2007上进行的实验结果表明,与Anti-TrustRank和WATR相比,TLDR的Spam Factor分别提高了45%和23.7%,F1-measure(阈值取600)分别提高了3.4个百分点和0.5个百分点,spam比例(前三个桶)分别提高了15个百分点和10个百分点。因此,主题与链接权重相结合的TLDR算法能有效提高垃圾网页检测性能。 展开更多
关键词 垃圾网页检测 作弊 排序算法 主题相似度 非信任值传播
下载PDF
基于页面链接挖掘的Web信息检索 被引量:6
10
作者 胡明 王小虎 刘钢 《情报杂志》 CSSCI 北大核心 2003年第9期21-22,25,共3页
对Web链接结构挖掘在信息检索方面上进行了研究 ,介绍了Web挖掘的概念、分类 ,以及HITS与Page -rank等算法 ,并提出了一种基于样本模式特征提取的信息检索方法 ,分析了Web链接挖掘面临的问题和未来研究的发展趋势。
关键词 WEB信息 网络信息 信息检索 网页 页面结构 网络数据挖掘 HITS算法 Page-rank算法
下载PDF
一种改进的搜索引擎网页排序算法 被引量:3
11
作者 王秀平 李治柱 《计算机科学》 CSCD 北大核心 2004年第B09期17-19,共3页
本文在分析目前流行的基于链接分析的搜索引擎网页排序算法的基础上,指出基于链接分析网页排序算法未充分考虑网站性能因素。针对这一缺点,本文提出了一种改进的网页排序算法,它考虑了网站的性能等因素,对提高搜索引肇的服务质量有... 本文在分析目前流行的基于链接分析的搜索引擎网页排序算法的基础上,指出基于链接分析网页排序算法未充分考虑网站性能因素。针对这一缺点,本文提出了一种改进的网页排序算法,它考虑了网站的性能等因素,对提高搜索引肇的服务质量有很好的参考价值。 展开更多
关键词 排序算法 网页 搜索引擎 分析 网站 性能 服务质量 参考价值 因素 基础
下载PDF
基于重引力搜索链接预测和评分传播的大数据推荐系统 被引量:4
12
作者 李贞 吴勇 耿海军 《计算机应用与软件》 北大核心 2020年第2期39-47,共9页
大数据推荐系统的搜索空间较大导致推荐的响应时间过长。为权衡大数据推荐系统的时间效率和推荐性能,提出一种基于重引力搜索链接预测和评分传播的大数据推荐系统。采用相对相似性指数度量用户的相似性,采用广义Meta Path模型建立相似图... 大数据推荐系统的搜索空间较大导致推荐的响应时间过长。为权衡大数据推荐系统的时间效率和推荐性能,提出一种基于重引力搜索链接预测和评分传播的大数据推荐系统。采用相对相似性指数度量用户的相似性,采用广义Meta Path模型建立相似图;引入社区信息来提高局部链接预测的准确率,从强社区提取优化的子图来实现局部链接的预测,通过重引力搜索对子图做优化处理,从而缩小搜索空间;设计基于传染病模型的网络传播策略,根据已有的模式探索隐藏的模式。基于公开数据集的实验结果表明,该算法有效地提高了推荐系统的准确率和覆盖率,并且响应时间在可接受的范围内。 展开更多
关键词 重引力搜索算法 评分传播 协同过滤 推荐系统 社区检测 预测
下载PDF
基于Python的动态网页评价爬虫算法 被引量:20
13
作者 夏火松 李保国 《软件工程》 2016年第2期43-46,共4页
在大数据获取中面临着如何采集动态评论网页的问题,这篇论文使用静态网页信息构造动态链接,提出了基于Python的动态网页评论爬虫算法。在此基础上实现了评论收集程序。最后将它与通用爬虫算法进行比较,证实了该算法具有针对性强、数据... 在大数据获取中面临着如何采集动态评论网页的问题,这篇论文使用静态网页信息构造动态链接,提出了基于Python的动态网页评论爬虫算法。在此基础上实现了评论收集程序。最后将它与通用爬虫算法进行比较,证实了该算法具有针对性强、数据采集速度快、易嵌入开发、简单等优点,为不善于编程的新闻、文学、管理等学科的研究者提供了快速获取评论信息的方法。 展开更多
关键词 PYTHON语言 静态地址 动态 动态网页评论 爬虫算法
下载PDF
基于网页分块思想的PageRank算法研究与优化
14
作者 李卫东 唐国华 《科技经济市场》 2011年第5期7-9,共3页
PageRank是一种典型的搜索结果排序算法。本文首先分析了PageRank算法的工作原理及网页分块的基本思想;然后研究了一种基于VIPS分块技术的块级PageRank改进算法,并提出了简化网页分块过程、融合计算PageRank排名值等优化措施;最后对该... PageRank是一种典型的搜索结果排序算法。本文首先分析了PageRank算法的工作原理及网页分块的基本思想;然后研究了一种基于VIPS分块技术的块级PageRank改进算法,并提出了简化网页分块过程、融合计算PageRank排名值等优化措施;最后对该算法的应用实现进行了必要的展望。 展开更多
关键词 网页分块 VIPS算法 分析 PAGERANK算法
下载PDF
基于PageRank与HITS的改进算法的网页排名优化 被引量:11
15
作者 库珊 刘钊 《武汉科技大学学报》 CAS 北大核心 2019年第2期155-160,共6页
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为... 针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。 展开更多
关键词 PAGERANK算法 HITS算法 结构 网页排序 算法改进
下载PDF
引入主题链接块因子的候选链接搜索策略研究 被引量:1
16
作者 周雪 刘乃文 《计算机与数字工程》 2018年第5期874-878,共5页
网页主题爬取过程中,需要计算网页中出现的url权重,不断填充待爬行队列,以满足爬行条件,如何发现与主题最相关的链接,同时又不会导致"主题漂移"问题是关键。针对链接的锚文本较短小,不能很好地表明链接指向页面与主题的相关... 网页主题爬取过程中,需要计算网页中出现的url权重,不断填充待爬行队列,以满足爬行条件,如何发现与主题最相关的链接,同时又不会导致"主题漂移"问题是关键。针对链接的锚文本较短小,不能很好地表明链接指向页面与主题的相关性的问题,论文在Shark-search算法的基础上引入相关链接块权重,利用块中子链接的锚文本进行块的权重计算,通过对比实验验证了改进算法可以更好地区分处于同一页面中的链接的相关度评分,提高爬虫的查准率,同时缓和"主题漂移"的问题。 展开更多
关键词 网页分块 Shark-search算法 结构 主题
下载PDF
SALSA算法技术剖析 被引量:3
17
作者 何晓阳 吴治蓉 +1 位作者 连丽红 谢永碧 《情报杂志》 CSSCI 北大核心 2004年第7期26-27,共2页
介绍了SALSA算法的基本原理及算法步骤 ;同时 ,分别将其与PageRank算法及HITS算法从多个方面进行了比较分析。
关键词 搜索引擎 网页排序 网页 SALSA算法 PAGERANK HITS
下载PDF
基于蚁群算法的Web站点导航 被引量:5
18
作者 业宁 梁作鹏 董逸生 《应用科学学报》 CAS CSCD 2003年第4期357-361,共5页
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结... 提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度. 展开更多
关键词 蚁群算法 Web站点导航 网页 WEB日志 数据挖掘 概率 用户行为规则 有向图
下载PDF
一种多特征因子融合的PageRank算法研究 被引量:3
19
作者 齐向明 孙文心 《计算机工程与应用》 CSCD 北大核心 2017年第7期97-103,共7页
针对PageRank算法完全依据链接结构排序,未考虑网页内容分析,造成平均分配PR值、主题漂移、偏重旧网页的现象,且已有改进算法存在单一性优化等问题,提出一种多特征因子融合的PageRank算法。该算法为使搜索结果更接近用户查询需求,同时... 针对PageRank算法完全依据链接结构排序,未考虑网页内容分析,造成平均分配PR值、主题漂移、偏重旧网页的现象,且已有改进算法存在单一性优化等问题,提出一种多特征因子融合的PageRank算法。该算法为使搜索结果更接近用户查询需求,同时兼顾搜索内容的相关度和查准率,通过添加链入链出权重因子、用户反馈因子、主题相关因子和时间因子,共同改善PageRank算法存在的不足。实验结果表明,所提算法在内容相关性和查准率方面,较其他网页排序算法有明显提高,达到优化Page Rank算法的目的。 展开更多
关键词 PAGERANK算法 结构 网页内容 出权重因子 用户反馈因子 主题相关因子 时间因子
下载PDF
改进的Shark-search算法在网络采集中的应用 被引量:1
20
作者 张玲 祁玉娟 姜华 《计算机技术与发展》 2017年第8期192-194,199,共4页
Shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研... Shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研究,提出了一种基于网页主题分块的Shark-search算法。该算法在经典Shark-search算法的基础上依据网页组织结构根据网页布局标签对页面内容进行分块,从网页,块和链接三个层面与主题的相关性得到链接的综合价值,因而具有自学习功能,能统计学习与主题相关性较大的块特征,并在发生主题漂移的时候具有自调整功能,给予主题相关性较大的父页面上的链接更多被抓取的机会。采集实验结果表明,所提出的算法在经典Shark-search的基础上能较好地改进主题信息采集的查准率,能够更灵活地针对实际的Web资源状况进行自调整。 展开更多
关键词 Shark-search算法 网页分块 Web信息搜集 价值 主题漂移
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部