-
题名基于Web链接分析的HITS算法研究与改进
被引量:6
- 1
-
-
作者
喻金平
朱桂祥
梅宏标
-
机构
江西理工大学工程研究院
江西理工大学信息工程学院
江西理工大学应用科学学院
-
出处
《计算机工程与应用》
CSCD
2013年第21期42-45,共4页
-
基金
江西省教育厅自然科学基金项目(No.GJJ12346)
-
文摘
垂直搜索引擎的主题搜索策略有基于内容评价的搜索策略和基于Web链接分析的搜索策略,其中HITS算法是一种经典的基于Web链接分析的搜索策略,其主要的缺点是容易发生主题漂移。为了最大程度地避免主题漂移,提出了一种结合网页文本分析和扩散速率改进的F-HITS算法。实验结果表明,这些改进不仅节省了系统的开销,并且提高了页面搜索的准确率。
-
关键词
垂直搜索
搜索策略
扩散速率
文本分析
超链接分析主题搜索(hits)
-
Keywords
vertical search
search strategy
diffusion rate
text analysis
hyperlink-lnduced topic search(hits)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名Web结构挖掘中HITS算法的改进
被引量:3
- 2
-
-
作者
郭鸿
周娅
-
机构
桂林电子科技大学计算机与控制学院
-
出处
《信息化纵横》
2009年第16期70-72,75,共4页
-
基金
广西青年科学基金(桂科青0832101)
-
文摘
HITS算法是Web结构挖掘中一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种基于文本内容和链接分析相结合的改进算法。实验证明改进后的算法提高了查询结果的相关度,降低了主题漂移的可能性。
-
关键词
hits算法
主题漂移
权威网页
中心网页
-
Keywords
hits (hyperlink-induced topic search)
topic drift
text
authority web
hub web
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进HITS算法的电网脆弱集合快速评估
被引量:3
- 3
-
-
作者
袁博
张文一
张雪敏
-
机构
国网河北省电力有限公司经济技术研究院
电力系统及发电设备控制和仿真国家重点实验室(清华大学电机系)
-
出处
《电力系统及其自动化学报》
CSCD
北大核心
2020年第4期145-150,共6页
-
文摘
脆弱线路在连锁故障传播中起着推波助澜的作用。为了更加全面地辨识脆弱线路,本文提出一种基于超链接诱导主题搜索算法的电网脆弱线路识别方法。首先,利用线路开断后的潮流转移量与线路容量裕度建立各线路故障转移的相关性网络。其次,利用改进超链接诱导主题搜索算法,计算相关性网络中各线路的权威值和枢纽值。最后,结合基于蒙特卡罗采样的连锁故障仿真工具,在河北南网系统中验证了所提算法得到权威值排名和枢纽值排名的有效性。与现有方法相比,该方法既能准确识别排名高的脆弱线路,又具有计算速度快的优点。
-
关键词
超链接诱导主题搜索算法
脆弱线路
连锁故障
相关性矩阵
权威值
枢纽值
-
Keywords
hyperlink-induced topic search(hits)algorithm
vulnerable line
cascading failure
correlation matrix
authority index
hub index
-
分类号
TM7
[电气工程—电力系统及自动化]
-
-
题名Web结构挖掘
被引量:20
- 4
-
-
作者
杨炳儒
李岩
陈新中
王霞
-
机构
北京科技大学计算机科学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第20期28-30,共3页
-
基金
国家自然科学基金项目(698350010)
教育部科技重点项目(教技司[2000175])
-
文摘
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
-
关键词
WEB结构挖掘
PAGERANK
hits
SALSA
超链接
网页排序
-
Keywords
Web structure mining
PageRank
hyperlink-induced topic search(hits)
SALSA
-
分类号
TP393.01
[自动化与计算机技术—计算机应用技术]
-
-
题名面向垂直搜索引擎的主题提取算法
被引量:9
- 5
-
-
作者
吕林涛
陈丽萍
周红芳
-
机构
西安理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第15期44-46,共3页
-
基金
陕西省自然科学基础研究计划基金资助项目(2007F52)
-
文摘
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。
-
关键词
hits算法
垂直搜索引擎
超链接
主题漂移
-
Keywords
hits algorithm
vertical search engine
hyperlink
topic drift
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于超链接引导的主题搜索的主题敏感爬行方法
被引量:9
- 6
-
-
作者
蒋宗礼
徐学可
李帅
-
机构
北京工业大学计算机学院
清华大学电子工程系
-
出处
《计算机应用》
CSCD
北大核心
2008年第4期942-944,950,共4页
-
文摘
基于主题的信息采集是信息检索领域内一个新兴且实用的方法,通过将下载页面限定在特定的主题领域,来提高搜索引擎的效率和提供信息的质量。其思想是在爬行过程中按预先定义好的主题有选择地收集相关网页,避免下载主题不相关的网页,其目标是更准确地找到对用户有用的信息。探讨了主题爬虫的一些关键问题,通过改进主题模型、链接分类模型的学习方法及链接分析方法来提高下载网页的主题相关度及质量。在此基础上设计并实现了一个主题爬虫系统,该系统利用主题敏感HITS来计算网页优先级。实验表明效果良好。
-
关键词
主题爬虫
超链接引导的主题搜索
主题模型
-
Keywords
topic crawler
hyperlink -induced topic search (hits)
topic model
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名PH-MaxFlow算法发现Web社区
被引量:1
- 7
-
-
作者
郭希娟
刘静
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第5期113-116,共4页
-
文摘
HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlow算法的种子节点,使得发现的Web社区更精确。同时提出了一种有效的评价Web社区的标准,用这个标准对原始最大流算法和提出的PH-MaxFlow算法进行比较,从而得出PH-MaxFlow算法发现的Web社区与主题更相关。
-
关键词
WEB社区
基于超链接分析的主题搜索算法
最大流算法
-
Keywords
Web communities
hyperlink-induced topic search(hits) algorithm
maximum flow algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web结构挖掘算法的网站构建
被引量:1
- 8
-
-
作者
叶琳莉
林嵩凯
-
机构
福建农林大学计算与信息学院
福建省邮电学校
-
出处
《电脑知识与技术》
2008年第12期1619-1620,1629,共3页
-
文摘
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖掘算法分析比较。通过对算法规律的研究,指出在网站设计规划时的策略以提高网站的价值。
-
关键词
WEB结构挖掘
PAGERANK
hits
算法
-
Keywords
web structure mining
pagerank
hyperlink-induced topic search (hits)
agorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于链接相似度Web挖掘算法的研究与改进
被引量:5
- 9
-
-
作者
杨益凡
朱明
李华虎
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
2011年第1期272-273,301,共3页
-
文摘
在Web挖掘分类模式基础上,研究和分析了基于链接分析的Web结构挖掘算法HITS(Hyperlink induced topic Search)。针对HITS算法在获取拓展集处理过程中只考虑基于根集网页链接出、入网页,不考虑出、入网页相似度的不足之处,提出了一种改进的DS-HITS(Document Similarity hyperlink induced topic search)算法。该算法在拓展集处理过程中引进多种反映网页相似度的权值,从而使获取的网页在核心和权威值方面明显得到改进。最后,基于Webla开源项目初始数据,对比了DS-HITS算法和HITS算法的搜索结果。
-
关键词
WEB挖掘
hits算法
DS-hits算法
-
Keywords
Web mining hits(hyperlink induced topic search) algorithm DS-hits(Document similarity hyperlink induced topic search) algorithm
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-