Web上基于特定主题的RG-HITS算法研究被引量：2

The Research of Resemblance Graph-HITS Algorithm Based on the Specific Topic on Web

下载PDF

导出

摘要 Web信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。 Information Retrieval (IR) on the Web is the automatic retrieval of all relevant documents, the same as resource finding of intended Web documents, while the same time retrieves as few of the non - relevant as possible. Web IR has become very popular and favorite at present. It concentrates on the using traditional text IR methods in the Internet, as well as the properties of Web graph. This research focuses on how to effectively and broadly get relevant Web pages and contents, filter Web pages and assign proper labels for them. Accurate finding user-specific information in the Web is very difficult. And traditional Web search engines take a query as input and produce a set of (hopefully) relevant pages that match the query terms. While useful in many circumstances, search engines have the disadvantage that users have to formulate queries that specify their information need, which is prone to errors. Based on the discussion of Page Rank, HITS and similarity between Web texts, some new algorithms called RG-HITS ( Resemblance Graph-HITS) for finding relevant documents on the Web are introduced.

作者丁一

机构地区湖北师范学院计算机科学与技术系

出处《现代图书情报技术》 CSSCI 北大核心 2005年第6期26-29,38,共5页 New Technology of Library and Information Service

关键词知识发现网页搜索相似度计算信息检索 Web mining Web search Similarity scoring Information retrieval

分类号 TP393.092 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Filippo Menczer, Gautam Pant, Padmini Srinivasan, et al. Evaluating Topic- Driven Web Crawlers. 21st ACM International Conference on Research and Development in Information Retrieval . New Orleans, Lonisiana, USA. 2002:241 - 249
2T. Hofmann. The cluster- abstraction model: Unsupervised learning of topic hierarchies from text data. Proceedings of 16th International Joint Conference on Artificial Intelligence ( IJCAI' 99 ). Stockholm,Sweden. 1999:682 - 687
3Kleinberg M. Authoritative Sources in a Hyperlinked Eveironment. Journal of the ACM, 1999,46 ( 5 ) :604 - 632
4U. Y. Nahm and R. J. Mooney. Ua mutually beneficial integration of data mining and information extraction. Proceedings of the 17th National Conference on Artificial Intelligence (AAAI′00). AAAI Press,2000:627 - 632
5叶允明马范援于水.Igloo分布式爬虫系统的性能优化[A].李晓明李星主编.搜索引擎与Web挖掘进展[C].北京:高等教育出版社,2003.1-8.

同被引文献9

1许丽丽.专业搜索引擎对比研究[J].现代情报,2005,25(1):188-190. 被引量：12
2谈大军,林明茵,叶赛.中文Google和百度的排序方式与检索效率比较分析[J].现代情报,2005,25(3):87-89. 被引量：10
3陈朝晖.网络新闻搜索引擎Deja News研究[J].现代图书情报技术,1998(6):32-35. 被引量：5
4张琳.WWW上基于概念的智能搜索[J].上海海运学院学报,2000,21(4):118-123. 被引量：11
5陈新明,钟涛,万钧,吴杰,张世永.WWW搜索引擎的数据采集技术[J].计算机工程与应用,2002,38(7):145-147. 被引量：10
6邓志鸿,唐世渭,张铭,杨冬青,陈捷.Ontology研究综述[J].北京大学学报（自然科学版）,2002,38(5):730-738. 被引量：764
7陆玉昌,鲁明羽,李凡,周立柱.向量空间法中单词权重函数的分析和构造[J].计算机研究与发展,2002,39(10):1205-1210. 被引量：126
8武旭,须德.基于向量空间模型的文本自动分类系统的研究与实现[J].北方交通大学学报,2003,27(2):38-41. 被引量：13
9王晓宇,周傲英.万维网的链接结构分析及其应用综述[J].软件学报,2003,14(10):1768-1780. 被引量：61

引证文献2

1王晶,陈卫卫.AJAX搜索引擎研究[J].电脑知识与技术,2009,5(7):5124-5127. 被引量：3
2王梅.搜索引擎中的web链接算法研究与改进[J].电脑知识与技术,2009,5(8X):6748-6749.

二级引证文献3

1费华英,郑淑丽.AJAX技术在Web应用中的研究与实现[J].电脑知识与技术,2010(11):8869-8870. 被引量：3
2熊文,熊淑华,孙旭,张朝阳.Ajax技术在Web2.0网站设计中的应用研究[J].计算机技术与发展,2012,22(3):145-148. 被引量：56
3李志河,王岚,冯利星.高职院校网络教学资源库系统的研究与设计[J].中国远程教育,2013(11):69-75. 被引量：25

1王远轩,臧斌宇.一种用户可控的位置信息模糊系统[J].计算机应用与软件,2014,31(8):304-306.
2王天江,叶卫国,卢正鼎,李永平.基于Hyperlink和相关度发现Web相关文档的研究[J].小型微型计算机系统,2004,25(5):859-862. 被引量：2
3陈冈,舒建文.构造基于Intranet的Web信息搜索服务[J].计算机与数字工程,2005,33(3):118-120.
4吴大猛,钱江波,陈叶芳,董一鸿.延迟容忍网络中基于邻居信息精确度的查询算法[J].电信科学,2014,30(4):100-108. 被引量：3
5胡越.论网站优化排名的策略[J].科技风,2009(21). 被引量：1
6图书推荐[J].信息安全与通信保密,2015,13(8):71-71.
7崔志明,谢春丽.基于Web的文本挖掘研究[J].微电子学与计算机,2002,19(10):51-53. 被引量：14
8李慧芳,潘达儒.无线传感器网络中信息精确度的建模与分析(英文)[J].科学技术与工程,2006,6(22):3581-3586.
9李锦茴,李志坚.无线传感器网络中信息精确度与能耗的关系综述(英文)[J].科学技术与工程,2008,8(18):5207-5215.
10李慧芳,姜胜明,韦岗.无线传感器网络中面向应用的信息精确度与能耗的建模与分析[J].传感技术学报,2007,20(2):408-412. 被引量：2

现代图书情报技术

2005年第6期

浏览历史

内容加载中请稍等...

Web上基于特定主题的RG-HITS算法研究被引量：2

参考文献5

同被引文献9

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

Web上基于特定主题的RG-HITS算法研究 被引量：2

参考文献5

同被引文献9

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

Web上基于特定主题的RG-HITS算法研究被引量：2