期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于Timed-HITS与协同过滤的混合推荐算法 被引量:2
1
作者 孙艳蕊 陈月 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第4期467-472,477,共7页
用户间的信任关系、用户对商品的偏好兴趣及商品的时效性都会影响对商品的推荐效果.将这些因素引入到基本的HITS算法中,对HITS算法进行了改进.将用户对商品的偏好兴趣矩阵进行了改进,利用隐馈数据通过逻辑回归算法估计用户对商品的偏好... 用户间的信任关系、用户对商品的偏好兴趣及商品的时效性都会影响对商品的推荐效果.将这些因素引入到基本的HITS算法中,对HITS算法进行了改进.将用户对商品的偏好兴趣矩阵进行了改进,利用隐馈数据通过逻辑回归算法估计用户对商品的偏好兴趣,对评分为零的情况赋予了不同的偏好兴趣度,这样更符合实际.将改进的HITS算法和协同过滤算法相结合得到一个混合推荐算法,同时将用户分为活跃用户和非活跃用户分别进行推荐.将提出的算法在Movielens数据集上进行了试验,结果表明该算法在一定程度上缓解了数据稀疏和冷启动的问题,推荐效果优于基于用户的协同过滤算法. 展开更多
关键词 hits 信任关系 偏好兴趣 协同过滤 推荐算法
下载PDF
Web结构挖掘中HITS算法的改进 被引量:3
2
作者 郭鸿 周娅 《信息化纵横》 2009年第16期70-72,75,共4页
HITS算法是Web结构挖掘中一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种基于文本内容和链接分析相结合的改进算法。实验证明改进后的算法提高了查询结果的相关度,降低了主题漂移的可能性。
关键词 hits算法 主题漂移 权威网页 中心网页
下载PDF
基于改进HITS算法的电网脆弱集合快速评估 被引量:3
3
作者 袁博 张文一 张雪敏 《电力系统及其自动化学报》 CSCD 北大核心 2020年第4期145-150,共6页
脆弱线路在连锁故障传播中起着推波助澜的作用。为了更加全面地辨识脆弱线路,本文提出一种基于超链接诱导主题搜索算法的电网脆弱线路识别方法。首先,利用线路开断后的潮流转移量与线路容量裕度建立各线路故障转移的相关性网络。其次,... 脆弱线路在连锁故障传播中起着推波助澜的作用。为了更加全面地辨识脆弱线路,本文提出一种基于超链接诱导主题搜索算法的电网脆弱线路识别方法。首先,利用线路开断后的潮流转移量与线路容量裕度建立各线路故障转移的相关性网络。其次,利用改进超链接诱导主题搜索算法,计算相关性网络中各线路的权威值和枢纽值。最后,结合基于蒙特卡罗采样的连锁故障仿真工具,在河北南网系统中验证了所提算法得到权威值排名和枢纽值排名的有效性。与现有方法相比,该方法既能准确识别排名高的脆弱线路,又具有计算速度快的优点。 展开更多
关键词 超链接诱导主题搜索算法 脆弱线路 连锁故障 相关性矩阵 权威值 枢纽值
下载PDF
A New Generalized Similarity-Based Topic Distillation Algorithm
4
作者 ZHOU Hongfang DANG Xiaohui 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期789-792,共4页
The procedure of hypertext induced topic search based on a semantic relation model is analyzed, and the reason for the topic drift of HITS algorithm was found to prove that Web pages are projected to a wrong latent se... The procedure of hypertext induced topic search based on a semantic relation model is analyzed, and the reason for the topic drift of HITS algorithm was found to prove that Web pages are projected to a wrong latent semantic basis. A new concept-generalized similarity is introduced and, based on this, a new topic distillation algorithm GSTDA(generalized similarity based topic distillation algorithm) was presented to improve the quality of topic distillation. GSTDA was applied not only to avoid the topic drift, but also to explore relative topics to user query. The experimental results on 10 queries show that GSTDA reduces topic drift rate by 10% to 58% compared to that of HITS(hypertext induced topic search) algorithm, and discovers several relative topics to queries that have multiple meanings. 展开更多
关键词 generalized similarity hypertext induced topic search topic distillation topic drift
下载PDF
一种基于信息检索技术的网络新闻影响力分析方法 被引量:19
5
作者 杨伟杰 戴汝为 崔霞 《软件学报》 EI CSCD 北大核心 2009年第9期2397-2406,共10页
利用信息检索领域中的相关算法,分析研究通过信息检索相关技术得到的相关信息,建立了一个网络新闻影响力模型来定量地计算一则新闻的影响力,从而估计它对社会安全产生影响的程度.在对大量实验结果的统计分析中发现,此方法可以有效地对... 利用信息检索领域中的相关算法,分析研究通过信息检索相关技术得到的相关信息,建立了一个网络新闻影响力模型来定量地计算一则新闻的影响力,从而估计它对社会安全产生影响的程度.在对大量实验结果的统计分析中发现,此方法可以有效地对新闻文章进行排序,发现不同新闻类型中最值得关注的新闻,其结果与人的定性判断结果具有较高的一致性. 展开更多
关键词 信息检索 社会安全 新闻影响力 hits(hypertext induced topic selection)算法 中国互联网指数系统(CIIS)
下载PDF
Web结构挖掘 被引量:20
6
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 WEB结构挖掘 PAGERANK hits SALSA 超链接 网页排序
下载PDF
一种基于超链接引导的主题搜索的主题敏感爬行方法 被引量:9
7
作者 蒋宗礼 徐学可 李帅 《计算机应用》 CSCD 北大核心 2008年第4期942-944,950,共4页
基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目... 基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目标是更准确地找到对用户有用的信息。探讨了主题爬虫的一些关键问题,通过改进主题模型、链接分类模型的学习方法及链接分析方法来提高下载网页的主题相关度及质量。在此基础上设计并实现了一个主题爬虫系统,该系统利用主题敏感HITS来计算网页优先级。实验表明效果良好。 展开更多
关键词 主题爬虫 超链接引导的主题搜索 主题模型
下载PDF
基于模糊集的主题提取和层次发现算法 被引量:1
8
作者 周红芳 冯博琴 《计算机工程》 CAS CSCD 北大核心 2007年第18期40-41,44,共3页
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,... 从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的。FSTH采用模糊集划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面。在14个查询上的实验结果表明,与HITS算法相比,FSTH算法不仅可以减少7%~53%的主题漂移率,而且可以发现与查询相关的多个主题。 展开更多
关键词 模糊集 超链归纳主题搜索 主题提取 主题漂移 查询扩展
下载PDF
基于切平面的主题提取算法 被引量:1
9
作者 李芳 柯熙政 《计算机工程与应用》 CSCD 北大核心 2007年第25期172-174,191,共4页
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此引入局部密集因子LDF(Local Density Factor)的概念。为了解决Web内容的重叠性,基于切平面的概念提出了一种新的主题提... 从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此引入局部密集因子LDF(Local Density Factor)的概念。为了解决Web内容的重叠性,基于切平面的概念提出了一种新的主题提取算法(CPTDA)。CPTDA不但可以发现用户最感兴趣的主题页面集合,还可以发现与查询相关的其他页面集合。在10个查询上的实验结果表明,与HITS算法相比,CPTDA算法不仅可以减少30%-52%的主题漂移率,而且可以发现与查询相关的多个主题。 展开更多
关键词 局部密集因子 切平面 超链归纳主题搜索 主题提取 主题漂移
下载PDF
PH-MaxFlow算法发现Web社区 被引量:1
10
作者 郭希娟 刘静 《计算机工程与应用》 CSCD 北大核心 2009年第5期113-116,共4页
HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlo... HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlow算法的种子节点,使得发现的Web社区更精确。同时提出了一种有效的评价Web社区的标准,用这个标准对原始最大流算法和提出的PH-MaxFlow算法进行比较,从而得出PH-MaxFlow算法发现的Web社区与主题更相关。 展开更多
关键词 WEB社区 基于超链接分析的主题搜索算法 最大流算法
下载PDF
基于Web结构挖掘算法的网站构建 被引量:1
11
作者 叶琳莉 林嵩凯 《电脑知识与技术》 2008年第12期1619-1620,1629,共3页
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖掘算法分析比较。通过对算法规律的研究,指出在网站设计规划时的策略以提高网站的价值。
关键词 WEB结构挖掘 PAGERANK hits 算法
下载PDF
一种面向专业搜索引擎的查询推荐算法 被引量:4
12
作者 王桂华 秦湘清 +2 位作者 陈黎 王亚强 于中华 《计算机工程与应用》 CSCD 2013年第9期144-149,共6页
根据专业搜索引擎的特点,提出了一种新颖的基于词语共现与HITS算法的查询推荐算法QR-CH(Query Recom-mendation algorithm based on word Co-occurrence and HITS algorithm)。该算法一方面利用HITS算法对基于词语共现筛选出的关联词按... 根据专业搜索引擎的特点,提出了一种新颖的基于词语共现与HITS算法的查询推荐算法QR-CH(Query Recom-mendation algorithm based on word Co-occurrence and HITS algorithm)。该算法一方面利用HITS算法对基于词语共现筛选出的关联词按语义关联性进行排序,选取排序靠前的关联词作为推荐词,提高了推荐词与原查询词的相关性;另一方面使用HITS算法排序关联文档,从查询结果文档集的角度来判断推荐是否冗余,降低了推荐词的冗余性。该算法将推荐相关的信息存储到知识树中,利用知识树实现查询推荐。实验结果表明QR-CH算法在推荐词的相关性和冗余词的判断方面均优于文献中已有的类似算法。 展开更多
关键词 查询推荐 词语共现 超链诱导主题搜索(hits)算法 专业搜索引擎
下载PDF
基于链接相似度Web挖掘算法的研究与改进 被引量:5
13
作者 杨益凡 朱明 李华虎 《计算机应用与软件》 CSCD 2011年第1期272-273,301,共3页
在Web挖掘分类模式基础上,研究和分析了基于链接分析的Web结构挖掘算法HITS(Hyperlink induced topic Search)。针对HITS算法在获取拓展集处理过程中只考虑基于根集网页链接出、入网页,不考虑出、入网页相似度的不足之处,提出了一种改进... 在Web挖掘分类模式基础上,研究和分析了基于链接分析的Web结构挖掘算法HITS(Hyperlink induced topic Search)。针对HITS算法在获取拓展集处理过程中只考虑基于根集网页链接出、入网页,不考虑出、入网页相似度的不足之处,提出了一种改进的DS-HITS(Document Similarity hyperlink induced topic search)算法。该算法在拓展集处理过程中引进多种反映网页相似度的权值,从而使获取的网页在核心和权威值方面明显得到改进。最后,基于Webla开源项目初始数据,对比了DS-HITS算法和HITS算法的搜索结果。 展开更多
关键词 WEB挖掘 hits算法 DS-hits算法
下载PDF
考虑开断相对概率与后果的电网脆弱线路辨识 被引量:3
14
作者 单政博 王慧芳 +1 位作者 林冠强 何奔腾 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第3期560-568,共9页
综合线路开断的相对概率和开断后果,考虑网架拓扑结构及实时运行状态、电源及负荷分布以及线路的传输容量等关键电网信息,给出识别电网脆弱线路的新方法.首先,定义单位熵综合负载率来描述电网的脆弱性,以线路开断前后该指标的变化,并用... 综合线路开断的相对概率和开断后果,考虑网架拓扑结构及实时运行状态、电源及负荷分布以及线路的传输容量等关键电网信息,给出识别电网脆弱线路的新方法.首先,定义单位熵综合负载率来描述电网的脆弱性,以线路开断前后该指标的变化,并用线路两端节点的重要度对其进行修正,以此来衡量线路开断后果.为合理地评估节点重要度,引入广泛用于网页排序的HITS算法,并对算法进行适应性改进.然后,从线路自身故障率和线路运行时受负荷随机波动影响而潮流越限的相对概率两方面评估线路开断相对概率;给出电网脆弱线路识别流程.IEEE 39算例验证了所提方法合理有效. 展开更多
关键词 脆弱线路 潮流熵 节点重要度 hits算法
下载PDF
Event Detection and Identification of Influential Spreaders in Social Media Data Streams 被引量:6
15
作者 Leilei Shi Yan Wu +2 位作者 Lu Liu Xiang Sun Liang Jiang 《Big Data Mining and Analytics》 2018年第1期34-46,共13页
Microblogging, a popular social media service platform, has become a new information channel for users to receive and exchange the most up-to-date information on current events. Consequently, it is a crucial platform ... Microblogging, a popular social media service platform, has become a new information channel for users to receive and exchange the most up-to-date information on current events. Consequently, it is a crucial platform for detecting newly emerging events and for identifying influential spreaders who have the potential to actively disseminate knowledge about events through microblogs. However, traditional event detection models require human intervention to detect the number of topics to be explored, which significantly reduces the efficiency and accuracy of event detection. In addition, most existing methods focus only on event detection and are unable to identify either influential spreaders or key event-related posts, thus making it challenging to track momentous events in a timely manner. To address these problems, we propose a Hypertext-Induced Topic Search(HITS) based Topic-Decision method(TD-HITS), and a Latent Dirichlet Allocation(LDA) based Three-Step model(TS-LDA). TDHITS can automatically detect the number of topics as well as identify associated key posts in a large number of posts. TS-LDA can identify influential spreaders of hot event topics based on both post and user information.The experimental results, using a Twitter dataset, demonstrate the effectiveness of our proposed methods for both detecting events and identifying influential spreaders. 展开更多
关键词 event detection MICROBLOGGING hypertext-induced topic search(hits) Latent Dirichlet Allocation(LDA) IDENTIFICATION of influential SPREADER
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部