基于频繁链接的Web权威资源挖掘被引量：6

Mining Authoritative Web Resources Based on Frequent Hyperlinks

下载PDF

导出

摘要如何有效地利用Web这个巨大的信息库 ?传统的基于关键字的搜索引擎取得了一定的成绩 ,但是存在着查准率不高的问题 Web页面间链接结构事实上隐含地表达着权威的信息 ,这已被许多研究者用来试图改善Web信息检索(包括搜索引擎 )的性能 ,取得了较好的效果 ,但依然存在很大的改善空间为此 ,提出了FARMING(基于频繁度的Web图的权威资源挖掘 )算法诠释了新的权威页面定义 ,提出了带阶的频繁子图和权威社团等概念。 How to utilize the Web resources more efficiently? One of the noteworthy approaches is

作者楼宇波马坚周皓峰袁晴晴施伯乐

机构地区复旦大学计算机与信息技术系

出处《计算机研究与发展》 EI CSCD 北大核心 2003年第7期1095-1103,共9页 Journal of Computer Research and Development

基金国家自然科学基金 ( 6993 3 0 10 ) 国家"八六三"高技术研究发展计划基金 ( 2 0 0 2AA4Z3 43 0 )

关键词信息检索频繁子图权威页面权威社团 WEB挖掘 based search engine However, this approach brings negative influence on searching and weighting the perfect (i e the most authoritative) results Actually, hyperlinks between Web pages represent authority implicitly And the power of hyp

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献19

1G Slaton. Automatic Text Processing: The Transformation,Analysis, and Retrieval of Information by Computer. Reading,MA: Addison Wesley, 1989.
2E Voorhees, N gupta, B Johnson-Laird. Learning collection fusion strategies. ACM SIGIR Conf, Seattle, 1995.
3J Kleinberg. Authoritative sources in a hyperlinked environment.In: Proc of the 9th Annual ACM-SIAM Symposium on Discrete Algorithms. New York: ACM Press, 1998. 668--677.
4P K Reddy, M Kitsuregawa. Inferring Web communities through relaxed cocitation and dense bipartite graphs. 2001. http: //www. tkl. iis. u-tokyo, ac. jp/Kilab/Research/Paper/2001/reddy/6a6.pdf.
5D Florescu, A Levy, A Mendelzon. Database techniques for the World-Wide Web: A survey. ACM SIGMOD Record, 1998, 27(3): 59--74.
6J Cho, N Shivakumar, H Garcia-Molina. Finding replicated Web collections. The 2000 ACM SIGMOD on Managenment of Data,Dallas, 2000.
7K Wang, H Liu. Discovering typical structures of documents: A road map approach. The ACM SIGIR Conf on Research and Development in Information Retrieval, Melbourrne, 1998.
8L Katz. A new status index derived from sociometric analysis.Psychometrika, 1953, 18:39-43.
9C H Hubbel. An input-output approach to clique identification.Sociometry, 1965, 28 : 377- 399.
10E Garfield. Citation analysis as a tool in journal evaluation.Science, 1972, 178(4060): 471-479.

同被引文献59

1胡建武,何贞铭,张贻权.WEB日志挖掘及其实现[J].计算机工程与应用,2004,40(14):156-158. 被引量：13
2陈安龙,唐常杰,陶宏才,元昌安,谢方军.基于极大团和FP-Tree的挖掘关联规则的改进算法[J].软件学报,2004,15(8):1198-1207. 被引量：30
3Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18
4ShuChing Chen. Identifying topics for Web Documents through fuzzy association learning[J]. International Journal of Computational Intelligence and Applications, 2002, 2(3) : 277-285.
5Arash Rakhshan, Lawrence B Holder, Diane J Cook. Structural Web search engine[J].Intemational Journal on Artificial Intelligence Tools, 2004,13 (1): 27-44.
6Diane J Cook, Nitish Manocha, Lawrence B Holder. Using a graph-based data mining system to perform web search[J] .International Journal of Pattern Recognition and Artificial Intelligence, 2003,17(5): 705-720.
7Supriya Kumar D E, Radha Krishna E Mining Web data usingclustering technique for Web personalization [J]. International Journal of Computational Intelligence and Applications, 2002, 2(3): 255-265.
8CHEN Yu-ru, HUNG Ming-chuan, Don-lin YANG. Using data mining to construct an intelligent web search system[J]. International Journal of Computer Processing of Oriental Languages,2003,16 (2):143-170.
9Gordon S Linoff,Michael J A Berry.Mining the web:transforming customer data into customer value[M].北京:电子工业出版社.2004.
10Wen Gao, Shi Wang,Bin Liu. A dynamic recommendation system based on log mining[J]. International Journal of Foundation of Computer Science, 2002,13 (4): 521-530.

引证文献6

1周敏子,周皓峰,王晨,汪卫,施伯乐.使用频繁结构提炼网络权威资源[J].计算机研究与发展,2004,41(10):1614-1620. 被引量：1
2王艳辉,吴斌,王柏.频繁子图挖掘算法综述[J].计算机科学,2005,32(10):193-196. 被引量：12
3董德民,何钦铭.面向电子商务的Web挖掘技术及其应用研究[J].计算机工程与设计,2006,27(1):95-98. 被引量：3
4赵宝华.基于Web挖掘的远程教育课件访问模式分析系统[J].计算机应用与软件,2009,26(3):149-152. 被引量：2
5徐慧,陶宏.电子商务中的智能挖掘技术及其应用研究[J].漯河职业技术学院学报,2009,8(5):54-55.
6陆慧琳,黄博.基于双索引的子图查询算法[J].计算机工程,2015,41(1):44-48. 被引量：2

二级引证文献20

1赵娜,臧景才.多标记传播聚类算法在电子商务中的应用[J].青海大学学报（自然科学版）,2009,27(1):85-88.
2鲁慧民,冯博琴,宋擒豹.频繁子图挖掘研究综述[J].微电子学与计算机,2009,26(3):156-161. 被引量：1
3杜玮,包振健,李芳,焦岩.在电子商务网站中使用Web挖掘技术的研究[J].电脑知识与技术,2007(4):157-157.
4李欣.开放式空间数据挖掘集成系统的设计与实现[J].测绘与空间地理信息,2008,31(4):23-27. 被引量：5
5周军,姜元春,林文龙.基于有向带权图的Web用户浏览行为模型[J].情报理论与实践,2008,31(5):795-798. 被引量：1
6吴甲,陈崚.一种快速的频繁子图挖掘算法[J].计算机应用,2008,28(10):2533-2536. 被引量：4
7刘振,杨路明,彭佳扬.基于频繁模式树的频繁连通闭图集挖掘算法[J].计算机技术与发展,2009,19(5):37-40.
8曾水香,罗林波.基于改进Hits算法的多主题爬虫研究与实现[J].福建电脑,2010,26(5):88-89. 被引量：2
9潘怡,杜红燕.概念格在频繁模式挖掘中的应用研究[J].湖南科技大学学报（自然科学版）,2010,25(2):81-84.
10陈立宁,罗可.Apriori算法用于频繁子图挖掘的改进方法[J].计算机工程与应用,2011,47(10):113-117. 被引量：4

1楼宇波,马坚,周皓峰,袁晴晴,施伯乐.Web权威资源挖掘的一种有效方法[J].计算机工程,2003,29(z1):50-51.
2周勇,刘锋.基于粗糙集的Web结构挖掘[J].计算机技术与发展,2008,18(3):151-153. 被引量：1
3李瑾.基于二部图的P2P资源挖掘方法[J].电子世界,2012(13):7-8.
4王舜燕,甘泉.基于Web结构挖掘的HITS算法分析与改进[J].软件导刊,2007,6(2):67-68.
5周敏子,周皓峰,王晨,汪卫,施伯乐.使用频繁结构提炼网络权威资源[J].计算机研究与发展,2004,41(10):1614-1620. 被引量：1
6李水莲.数据库资源挖掘流程的自动控制[J].计算机光盘软件与应用,2014,17(3):152-152. 被引量：1
7周晓峥,刘勘,孟波,周洞汝.自组织映射在Web结构挖掘中的应用[J].计算机工程与应用,2003,39(3):31-33. 被引量：1
8王宝勋,刘秉权,孙承杰,王晓龙.网络问答资源挖掘综述[J].智能计算机与应用,2012,2(6):54-58.
9朱凡微,吴明晖,金苍宏,吕嘉,应晶.基于关键字的数据库搜索研究综述[J].计算机应用研究,2008,25(11):3238-3242. 被引量：9
10宋建康,张礼平.Web结构挖掘算法探讨[J].华东理工大学学报（自然科学版）,2003,29(5):537-540. 被引量：18

计算机研究与发展

2003年第7期

浏览历史

内容加载中请稍等...

基于频繁链接的Web权威资源挖掘被引量：6

参考文献19

同被引文献59

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于频繁链接的Web权威资源挖掘 被引量：6

参考文献19

同被引文献59

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于频繁链接的Web权威资源挖掘被引量：6