期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于Web链接分析的HITS算法研究与改进 被引量:6
1
作者 喻金平 朱桂祥 梅宏标 《计算机工程与应用》 CSCD 2013年第21期42-45,共4页
垂直搜索引擎的主题搜索策略有基于内容评价的搜索策略和基于Web链接分析的搜索策略,其中HITS算法是一种经典的基于Web链接分析的搜索策略,其主要的缺点是容易发生主题漂移。为了最大程度地避免主题漂移,提出了一种结合网页文本分析和... 垂直搜索引擎的主题搜索策略有基于内容评价的搜索策略和基于Web链接分析的搜索策略,其中HITS算法是一种经典的基于Web链接分析的搜索策略,其主要的缺点是容易发生主题漂移。为了最大程度地避免主题漂移,提出了一种结合网页文本分析和扩散速率改进的F-HITS算法。实验结果表明,这些改进不仅节省了系统的开销,并且提高了页面搜索的准确率。 展开更多
关键词 垂直搜索 搜索策略 扩散速率 文本分析 超链接分析主题搜索(hits)
下载PDF
Web结构挖掘中HITS算法的改进 被引量:3
2
作者 郭鸿 周娅 《信息化纵横》 2009年第16期70-72,75,共4页
HITS算法是Web结构挖掘中一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种基于文本内容和链接分析相结合的改进算法。实验证明改进后的算法提高了查询结果的相关度,降低了主题漂移的可能性。
关键词 hits算法 主题漂移 权威网页 中心网页
下载PDF
基于改进HITS算法的电网脆弱集合快速评估 被引量:3
3
作者 袁博 张文一 张雪敏 《电力系统及其自动化学报》 CSCD 北大核心 2020年第4期145-150,共6页
脆弱线路在连锁故障传播中起着推波助澜的作用。为了更加全面地辨识脆弱线路,本文提出一种基于超链接诱导主题搜索算法的电网脆弱线路识别方法。首先,利用线路开断后的潮流转移量与线路容量裕度建立各线路故障转移的相关性网络。其次,... 脆弱线路在连锁故障传播中起着推波助澜的作用。为了更加全面地辨识脆弱线路,本文提出一种基于超链接诱导主题搜索算法的电网脆弱线路识别方法。首先,利用线路开断后的潮流转移量与线路容量裕度建立各线路故障转移的相关性网络。其次,利用改进超链接诱导主题搜索算法,计算相关性网络中各线路的权威值和枢纽值。最后,结合基于蒙特卡罗采样的连锁故障仿真工具,在河北南网系统中验证了所提算法得到权威值排名和枢纽值排名的有效性。与现有方法相比,该方法既能准确识别排名高的脆弱线路,又具有计算速度快的优点。 展开更多
关键词 超链接诱导主题搜索算法 脆弱线路 连锁故障 相关性矩阵 权威值 枢纽值
下载PDF
Web结构挖掘 被引量:20
4
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 WEB结构挖掘 PAGERANK hits SALSA 超链接 网页排序
下载PDF
面向垂直搜索引擎的主题提取算法 被引量:9
5
作者 吕林涛 陈丽萍 周红芳 《计算机工程》 CAS CSCD 北大核心 2009年第15期44-46,共3页
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主... 针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。 展开更多
关键词 hits算法 垂直搜索引擎 超链接 主题漂移
下载PDF
一种基于超链接引导的主题搜索的主题敏感爬行方法 被引量:9
6
作者 蒋宗礼 徐学可 李帅 《计算机应用》 CSCD 北大核心 2008年第4期942-944,950,共4页
基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目... 基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目标是更准确地找到对用户有用的信息。探讨了主题爬虫的一些关键问题,通过改进主题模型、链接分类模型的学习方法及链接分析方法来提高下载网页的主题相关度及质量。在此基础上设计并实现了一个主题爬虫系统,该系统利用主题敏感HITS来计算网页优先级。实验表明效果良好。 展开更多
关键词 主题爬虫 超链接引导的主题搜索 主题模型
下载PDF
PH-MaxFlow算法发现Web社区 被引量:1
7
作者 郭希娟 刘静 《计算机工程与应用》 CSCD 北大核心 2009年第5期113-116,共4页
HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlo... HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlow算法的种子节点,使得发现的Web社区更精确。同时提出了一种有效的评价Web社区的标准,用这个标准对原始最大流算法和提出的PH-MaxFlow算法进行比较,从而得出PH-MaxFlow算法发现的Web社区与主题更相关。 展开更多
关键词 WEB社区 基于超链接分析的主题搜索算法 最大流算法
下载PDF
基于Web结构挖掘算法的网站构建 被引量:1
8
作者 叶琳莉 林嵩凯 《电脑知识与技术》 2008年第12期1619-1620,1629,共3页
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖掘算法分析比较。通过对算法规律的研究,指出在网站设计规划时的策略以提高网站的价值。
关键词 WEB结构挖掘 PAGERANK hits 算法
下载PDF
基于链接相似度Web挖掘算法的研究与改进 被引量:5
9
作者 杨益凡 朱明 李华虎 《计算机应用与软件》 CSCD 2011年第1期272-273,301,共3页
在Web挖掘分类模式基础上,研究和分析了基于链接分析的Web结构挖掘算法HITS(Hyperlink induced topic Search)。针对HITS算法在获取拓展集处理过程中只考虑基于根集网页链接出、入网页,不考虑出、入网页相似度的不足之处,提出了一种改进... 在Web挖掘分类模式基础上,研究和分析了基于链接分析的Web结构挖掘算法HITS(Hyperlink induced topic Search)。针对HITS算法在获取拓展集处理过程中只考虑基于根集网页链接出、入网页,不考虑出、入网页相似度的不足之处,提出了一种改进的DS-HITS(Document Similarity hyperlink induced topic search)算法。该算法在拓展集处理过程中引进多种反映网页相似度的权值,从而使获取的网页在核心和权威值方面明显得到改进。最后,基于Webla开源项目初始数据,对比了DS-HITS算法和HITS算法的搜索结果。 展开更多
关键词 WEB挖掘 hits算法 DS-hits算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部