期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于大规模网络社群分割的国际分众舆情分析——以2022年G20峰会为例
1
作者 杨帆 章耀之 张宏邦 《情报杂志》 CSSCI 北大核心 2023年第9期77-83,共7页
[研究目的]国际舆论研究既需要覆盖范围广泛,也需要针对细分群体进行分众化分析,而已有的以文本为中心的舆情分析方法难以满足上述需求。因此本文提出一种以网络为中心的国际分众舆情分析方法。[研究方法]首先采用个性化网页排名算法对... [研究目的]国际舆论研究既需要覆盖范围广泛,也需要针对细分群体进行分众化分析,而已有的以文本为中心的舆情分析方法难以满足上述需求。因此本文提出一种以网络为中心的国际分众舆情分析方法。[研究方法]首先采用个性化网页排名算法对社交媒体用户随机游走采样,得到未被社交机器人污染的大规模用户网络,然后基于社交媒体舆论嵌入在各种同质网络中这一特征,用经典稀疏主成分分析对用户网络进行社群聚类,将具有共同纽带或身份的个体划分入同一社群,最后用深度学习分别针对各个社群进行舆情分析。[研究结论]通过对2022年G20峰会的国际舆情分析,发现各社群的舆论表达与其身份高度相关,验证了本文提出方法的有效性。除了在对抗社交机器人干扰、用户群体细分方面做出改进性工作,本文还为国际舆情演化的实证研究提供了方法论支撑。 展开更多
关键词 舆情分析 国际舆论 社交媒体 网络社群 网页排名 社群发现 深度学习
下载PDF
基于协同标注的个性化电子学习推荐系统 被引量:2
2
作者 王丹 田广强 《计算机工程与设计》 北大核心 2023年第10期3193-3200,F0003,共9页
分析各种基于标注的推荐技术的适用性,通过张量因子分解技术对最佳模型排序方法进行改进;比较基于标注的协同过滤(CF)、基于图的方法(自适应Page-Rank和Folk-Rank算法)以及基于张量的方法(HOSVD和RTF)的预测性能,优选出最佳的推荐方案... 分析各种基于标注的推荐技术的适用性,通过张量因子分解技术对最佳模型排序方法进行改进;比较基于标注的协同过滤(CF)、基于图的方法(自适应Page-Rank和Folk-Rank算法)以及基于张量的方法(HOSVD和RTF)的预测性能,优选出最佳的推荐方案。通过在一个开发的编程辅导系统中的应用,验证了所提推荐系统的有效性。 展开更多
关键词 电子学习 学习风格 个性化推荐 协同标注 张量 网页排名 社会排名
下载PDF
基于页面链接挖掘的Web信息检索 被引量:6
3
作者 胡明 王小虎 刘钢 《情报杂志》 CSSCI 北大核心 2003年第9期21-22,25,共3页
对Web链接结构挖掘在信息检索方面上进行了研究 ,介绍了Web挖掘的概念、分类 ,以及HITS与Page -rank等算法 ,并提出了一种基于样本模式特征提取的信息检索方法 ,分析了Web链接挖掘面临的问题和未来研究的发展趋势。
关键词 WEB信息 网络信息 信息检索 网页 页面链接结构 网络数据挖掘 HITS算法 page-rank算法
下载PDF
Ranking of Web Pages in a Personalized Search
4
作者 Mahmoud Abou Ghaly 《Journal of Computer and Communications》 2023年第2期89-101,共13页
The basic idea behind a personalized web search is to deliver search results that are tailored to meet user needs, which is one of the growing concepts in web technologies. The personalized web search presented in thi... The basic idea behind a personalized web search is to deliver search results that are tailored to meet user needs, which is one of the growing concepts in web technologies. The personalized web search presented in this paper is based on exploiting the implicit feedbacks of user satisfaction during her web browsing history to construct a user profile storing the web pages the user is highly interested in. A weight is assigned to each page stored in the user’s profile;this weight reflects the user’s interest in this page. We name this weight the relative rank of the page, since it depends on the user issuing the query. Therefore, the ranking algorithm provided in this paper is based on the principle that;the rank assigned to a page is the addition of two rank values R_rank and A_rank. A_rank is an absolute rank, since it is fixed for all users issuing the same query, it only depends on the link structures of the web and on the keywords of the query. Thus, it could be calculated by the PageRank algorithm suggested by Brin and Page in 1998 and used by the google search engine. While, R_rank is the relative rank, it is calculated by the methods given in this paper which depends mainly on recording implicit measures of user satisfaction during her previous browsing history. 展开更多
关键词 Implicit Feedback Personalized Search Web Page Ranking User Profile
下载PDF
基于页面链接挖掘的Web教育信息检索 被引量:4
5
作者 王成云 王乐乐 《情报科学》 CSSCI 北大核心 2004年第4期475-477,487,共4页
教育信息检索是教育信息应用于教育科研与教育教学的关键环节 ,而 Web页面链接挖掘是对 Web页面之间的链接结构进行挖掘。本文对 Web链接结构挖掘在教育信息检索方面上进行了研究 ,介绍了 Web挖掘的概念、分类 ,以及 HITS与 Page- rank... 教育信息检索是教育信息应用于教育科研与教育教学的关键环节 ,而 Web页面链接挖掘是对 Web页面之间的链接结构进行挖掘。本文对 Web链接结构挖掘在教育信息检索方面上进行了研究 ,介绍了 Web挖掘的概念、分类 ,以及 HITS与 Page- rank等算法 ,并提出了一种基于样本模式特征提取的信息检索方法。 展开更多
关键词 教育信息 网络信息检索 页面链接 数据挖掘 WEB结构挖掘 HITS page-rank 算法
下载PDF
基于PageRank改进算法的电网脆弱线路快速辨识(一):理论基础 被引量:16
6
作者 马志远 刘锋 +2 位作者 沈沉 张爽 田蓓 《中国电机工程学报》 EI CSCD 北大核心 2016年第23期6363-6370,6601,共8页
作为两篇系列文章的第一篇,该文结合网络拓扑和电网运行状态,提出了一种适用于快速辨识电网脆弱线路的Page Rank改进算法并阐明其原理。首先,介绍Page Rank基本算法,并讨论了将其直接应用于辨识电网脆弱线路的局限性。其次,为了克服以... 作为两篇系列文章的第一篇,该文结合网络拓扑和电网运行状态,提出了一种适用于快速辨识电网脆弱线路的Page Rank改进算法并阐明其原理。首先,介绍Page Rank基本算法,并讨论了将其直接应用于辨识电网脆弱线路的局限性。其次,为了克服以上局限性,提出相关性网络和衍生网络的概念,然后在此基础上建立分析线路脆弱度Page Rank改进模型。最后,基于此模型给出线路脆弱度计算的解析表达式,并提出快速辨识脆弱线路的方法。 展开更多
关键词 连锁故障 PAGE Rank改进算法 电网 脆弱线路 快速辨识
下载PDF
基于Nutch农业搜索引擎的研究与设计 被引量:15
7
作者 周鹏 吴华瑞 +2 位作者 赵春江 杨宝祝 朱华吉 《计算机工程与设计》 CSCD 北大核心 2009年第3期610-612,共3页
针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合Page-Rank的改进算法对... 针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合Page-Rank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎。相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率。 展开更多
关键词 NUTCH 搜索引擎 农业词典 主题过滤 网页排序
下载PDF
基于网页链接和内容分析的改进PageRank算法 被引量:25
8
作者 钱功伟 倪林 +1 位作者 MIAO Yuan 曹荣 《计算机工程与应用》 CSCD 北大核心 2007年第21期160-164,共5页
结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选... 结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统PageRank算法的排序结果。 展开更多
关键词 PAGERANK 网页排序 链接分析 相关性分析
下载PDF
基于贝叶斯分类器的主题爬虫研究 被引量:17
9
作者 邹永斌 陈兴蜀 王文贤 《计算机应用研究》 CSCD 北大核心 2009年第9期3418-3420,3439,共4页
主题爬虫是实现定题搜索引擎的核心技术。提出了基于贝叶斯分类器实现主题爬虫的方法,介绍了基于贝叶斯分类器的主题爬虫的系统结构以及系统关键部分的实现,包括URL队列、爬行历史、页面下载以及页面分析,并重点介绍了基于贝叶斯分类器... 主题爬虫是实现定题搜索引擎的核心技术。提出了基于贝叶斯分类器实现主题爬虫的方法,介绍了基于贝叶斯分类器的主题爬虫的系统结构以及系统关键部分的实现,包括URL队列、爬行历史、页面下载以及页面分析,并重点介绍了基于贝叶斯分类器的主题相关度算法。爬虫使用改进的TF-IDF算法来提取网页内容的特征,并采用贝叶斯分类器计算其主题相关度。实验结果表明,在搜索大量网络资源的情况下,贝叶斯分类器比PageRank算法更适合用于实现主题爬虫。 展开更多
关键词 贝叶斯 分类器 主题爬虫 主题相关度
下载PDF
基于用户质量的微博社区博主影响力排序算法 被引量:10
10
作者 唐飞龙 叶施仁 肖春 《计算机工程与应用》 CSCD 北大核心 2015年第4期128-132,174,共6页
微博特有的移动终端轻博客发布与交互模式,使其迅速成为使用范围最大、影响力最大的社交媒体。新浪中文微博现有超过3亿用户,发展最为迅速,中文微博和其他微博相比具有独特性,一些大"V"博主的影响力堪比电台电视。通过分析微... 微博特有的移动终端轻博客发布与交互模式,使其迅速成为使用范围最大、影响力最大的社交媒体。新浪中文微博现有超过3亿用户,发展最为迅速,中文微博和其他微博相比具有独特性,一些大"V"博主的影响力堪比电台电视。通过分析微博的网络结构特征,总结出微博相对于其他传统社会载体的特性。利用Page Rank算法的思想,设计了基于用户质量的User Impack Rank(UIR)排序算法。UIR算法通过用户相对微力值和用户相对链接质量对各博主的影响力进行动态的评估。在一个活跃的微博社区数据集上进行了全面的实验,实验结果显示了UIR算法能更加准确和客观地对用户的影响力进行排序,并且能有效地消除僵尸粉丝对排序的影响。 展开更多
关键词 相对微力值 相对链接质量 PAGE RANK USER Impack RANK
下载PDF
搜索引擎页面排序算法研究综述 被引量:21
11
作者 李绍华 高文宇 《计算机应用研究》 CSCD 北大核心 2007年第6期4-7,共4页
系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格... 系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势。建立专业搜索引擎是提高搜索准确性和性能的有效途径。通过网格技术将各种专业搜索引擎集成在一起,形成一个基于网格的搜索引擎,从而更好地满足不同背景不同偏好的用户需求。 展开更多
关键词 搜索引擎 页面排序 链接分析
下载PDF
基于PageRank算法的权威值不均衡分配问题 被引量:20
12
作者 田甜 倪林 《计算机工程》 CAS CSCD 北大核心 2007年第18期53-55,共3页
PageRank对所链接的网页的"权威值"存在平均分配的思想,由于互联网的网页是千差万别的,因此这种方法存在一定的局限性。该文利用了Web链接结构,提出了一种权威值不均衡分配的方法(IPR),通过与PageRank算法相比,IPR的排序结果... PageRank对所链接的网页的"权威值"存在平均分配的思想,由于互联网的网页是千差万别的,因此这种方法存在一定的局限性。该文利用了Web链接结构,提出了一种权威值不均衡分配的方法(IPR),通过与PageRank算法相比,IPR的排序结果比PageRank提高了近90%的相关度。 展开更多
关键词 网页结构挖掘 网页排序 改进的PageRank
下载PDF
中文农业信息垂直搜索引擎的设计与实现 被引量:5
13
作者 夏斌 丁立 +1 位作者 乔红波 高瑞 《河南农业大学学报》 CAS CSCD 北大核心 2010年第6期715-717,共3页
本研究以用户对农业信息搜索需求为研究背景,设计实现了1个中文农业信息垂直搜索引擎,该系统采用向量空间模型对农业主题进行识别,并采用网页内容和链接分析相结合的方法,使排序结果更加合理,从而提高信息检索的效率和准确率.
关键词 垂直搜索引擎 农业信息 主题识别 页面排序
下载PDF
基于网页链接与用户反馈的PageRank算法改进研究 被引量:13
14
作者 曹姗姗 王冲 《计算机科学》 CSCD 北大核心 2014年第12期179-182,共4页
在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角... 在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角度共同对网页PR值进行合理分配,以在一定程度上达到高质量网页尽量排序靠前、信息价值低的网页尽量下沉的目的。仿真实验表明,BPR算法在一定程度上改善了排序效果,提升了用户信息检索满意度。 展开更多
关键词 网页排序 链接结构 用户反馈 PAGERANK 算法改进
下载PDF
Web页面主题相关性排序算法的研究 被引量:9
15
作者 何国斌 赵晶璐 《计算机工程与应用》 CSCD 北大核心 2009年第23期149-151,157,共4页
分析了Web页面主题的分布的特点,对经典的页面排序算法进行了探讨,提出了一种基于内容和超链接分析并结合用户点击行为的相关性排序算法。该算法考虑了超文本标记、锚文本、文本内容等对相关性的影响,引入动态比较矩阵来计算相应的权重... 分析了Web页面主题的分布的特点,对经典的页面排序算法进行了探讨,提出了一种基于内容和超链接分析并结合用户点击行为的相关性排序算法。该算法考虑了超文本标记、锚文本、文本内容等对相关性的影响,引入动态比较矩阵来计算相应的权重系数,能够客观分析网页所包含的主题信息,使检索结果排序更合理。实验表明,该算法能有效提高查准率,较好地解决了主题的漂移现象,且具有较好的性能。 展开更多
关键词 WEB页面 相关性 网页排序 比较矩阵
下载PDF
一种基于主题相关度的网页排序算法 被引量:3
16
作者 吴炜 梁昆 +2 位作者 李瑞轩 辜希武 卢正鼎 《微电子学与计算机》 CSCD 北大核心 2008年第9期221-224,共4页
针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上... 针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率. 展开更多
关键词 网页排序 主题相关度 链接分析 向量空间模型
下载PDF
基于Hadoop平台的Spark快数据推荐算法分析与应用 被引量:12
17
作者 陈虹君 吴雪琴 《现代电子技术》 北大核心 2016年第10期18-20,共3页
Hadoop大数据平台上可以搭建Yarn,Mahout,Storm,Graph Lab等框架,其提供了大数据的各种处理能力。但它们各自按自己的机制工作,整合度极低。虽然在Mahout框架中,对机器学习的算法支持较为完善,但是数据必需是离线的。在大数据时代,要求... Hadoop大数据平台上可以搭建Yarn,Mahout,Storm,Graph Lab等框架,其提供了大数据的各种处理能力。但它们各自按自己的机制工作,整合度极低。虽然在Mahout框架中,对机器学习的算法支持较为完善,但是数据必需是离线的。在大数据时代,要求不仅具有处理能力,还强调了数据的时效性,以前的框架都显得有点力不从心。Spark是Hadoop平台上的新型利器,它的各个部分几乎能替代以前的分散的框架,且采用统一的处理机制,整合度很好,速度比传统处理方式快几十倍甚至几百倍。基于Hadoop平台的Spark快数据推荐算法分析与应用是在Hadoop平台上用Yarn作资源管理,Spark作快数据的处理,这极大地提高了大数据的处理效率。该文以专业推荐系统为应用基础,采用Yarn作资源管理,及Spark ALS算法做推荐,Spark Page Rank算法做专业排名,实验结果表明,Spark框架对大数据的处理机制能够满足日益增值的大数据应用对速度的要求。 展开更多
关键词 HADOOP SPARK 快数据 ALS算法 PAGERANK算法
下载PDF
一种基于社会性标注的网页排序算法 被引量:19
18
作者 刘凯鹏 方滨兴 《计算机学报》 EI CSCD 北大核心 2010年第6期1014-1023,共10页
社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中,由此产生的大量社会性标注数据成为网页质量评价的一个新维度.文中研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关... 社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中,由此产生的大量社会性标注数据成为网页质量评价的一个新维度.文中研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法.首先利用统计主题模型,使用相关标签为网页和用户建模,并计算查询相关性.然后利用二部图模型刻画网页和用户间的互增强关系,并使用相关标签与用户兴趣和网页内容的匹配度为互增强关系赋予权重.最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的评分.实验结果表明,文中提出的检索模型和互增强模型能够有效地提高排序算法的性能.与目前的代表性算法相比,该算法在检索性能上有明显提高. 展开更多
关键词 社会性标注 网页检索 网页质量 排序算法 主题模型
下载PDF
基于网站影响力的网页排序算法 被引量:4
19
作者 张芳 郭常盈 《计算机应用》 CSCD 北大核心 2012年第6期1666-1669,共4页
传统的排序算法主要是根据网页之间的链接关系进行排序,没有考虑到网站与网页之间互相增强的关系和用户对网页的重要性的评价。为此提出了一种基于更新时间、网页权威性和用户对网页的反映的相关排序算法。该算法以网站为节点计算每个... 传统的排序算法主要是根据网页之间的链接关系进行排序,没有考虑到网站与网页之间互相增强的关系和用户对网页的重要性的评价。为此提出了一种基于更新时间、网页权威性和用户对网页的反映的相关排序算法。该算法以网站为节点计算每个网站权威值,在为网页分配权威值时考虑了网页在网站内的位置和用户对其的反映,并通过网站与网页之间相互影响的关系来相互反馈。实验结果表明,与传统的PageRank、HITS等排序算法相比,该算法在检索性能上有明显提高。 展开更多
关键词 网页排序 相关度 认可度 更新率 信息反馈
下载PDF
基于网页等级的PageRank算法改进 被引量:6
20
作者 马海波 陈时勇 《大连交通大学学报》 CAS 2010年第2期78-81,共4页
为了提高PageRank算法的准确性,从网络用户对已知网页进行评价的角度引入网页等级,从网页链接分析的角度解决权威性需求.结合网页链接分析和页面内容分析提出一种改进的PageRank算法PRP(PageRank based on Page-level).实验证明,算法为... 为了提高PageRank算法的准确性,从网络用户对已知网页进行评价的角度引入网页等级,从网页链接分析的角度解决权威性需求.结合网页链接分析和页面内容分析提出一种改进的PageRank算法PRP(PageRank based on Page-level).实验证明,算法为扩展PageRank提供了广阔的空间,通过选择合适的参数page-level,可以提高传统PageRank算法的网页排序的准确性,有效防止恶意链接对pagerank排序值(PR值)造成的影响. 展开更多
关键词 PAGERANK page-level 网页排序
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部