期刊文献+

基于Web页面链接结构的挖掘算法

The mining algorithm based on the hyperlinks between Web texts
原文传递
导出
摘要 介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题. This paper introduces the correlative theories about Web mining. We analyze the difference among several manners of Web content mining. Further more, we compare two kinds of algorithms based on Web structure mining, that is PageRank and HITS. In the end, some problems that should be considered in Web usage mining are put forward.
出处 《福州大学学报(自然科学版)》 CAS CSCD 2004年第4期476-478,共3页 Journal of Fuzhou University(Natural Science Edition)
基金 福建省自然科学基金资助项目(A0110009) 福建省教育厅科研资助项目(JB03026) 福州大学科技发展基金资助项目(2002-XQ-21)
关键词 WEB 页面 结构挖掘 超链接 算法 Web text structure mining hyperlink algorithm
  • 相关文献

参考文献5

二级参考文献18

  • 1Pitkow J E.Characterizing World Wide Web Ecologies [PhD Thesis]. Georgia Institute of Technology, 1997-06.
  • 2Weise R, Veles B.HyPursuit: A Hierarchical Network Search Engine that Exploits Content-link Hypertext Clustering.In Proceedings of the 7th ACM Conference on Hypertext, 1996-03.
  • 3Spertus E.Parasite: Mining Structural Information on the Web.In:Proc of the Sixth International World Wide Web Conference, 1997-04.
  • 4Kleinberg J M.Authoritative Sources in a Hyperlinked Environment. Proc 9th ACM Press,New York and Siam Press,Philadelphia,1998: 668-677.
  • 5Brin S, Page L. The anatomy of Large-scale Hypertextual Web Search Engine. In: Proc of the 7th Int'l World Wide Web Conf Brisbane, Austrilian, 1998.
  • 6胥桂仙.文本挖掘的一般性方法研究[M].长春:吉林工学院计算机科学与工程学院,2002..
  • 7蒋澄,马范援,蒋思杰.中英文WWW搜索引擎的信息处理[J].计算机工程,1999,25(4):37-38. 被引量:20
  • 8王伟强,高文,段立娟.Internet上的文本数据挖掘[J].计算机科学,2000,27(4):32-36. 被引量:60
  • 9刘芳,卢正鼎.有效地检索HTML文档[J].小型微型计算机系统,2000,21(9):986-988. 被引量:23
  • 10王继成,潘金贵,张福炎.Web文本挖掘技术研究[J].计算机研究与发展,2000,37(5):513-520. 被引量:275

共引文献31

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部