期刊文献+

Web站点核心逻辑结构挖掘 被引量:1

Website Kernel Logical Structure Mining
下载PDF
导出
摘要 已有Web结构挖掘研究主要是挖掘出站点的核心节点而非整个结构。为此,设计Web站点逻辑域核及其导入路径的模型,提出Web站点逻辑域核挖掘算法和逻辑域核导入路径挖掘算法。在4个大型Web站点上的实验结果表明,Web站点逻辑域核挖掘算法和导入路径挖掘算法均能够达到较高的精度和召回率。 Existing researches on Web structure mining focus on finding the authoritative vertexes instead of the whole Web hyperlink structure. This paper designs the Website logical domain core and the model of domain core's entry path, proposes logical domain core mining algorithm and its entry path mining algorithm. Through experiment on four large Websites, results show that both algorithms can achieve relatively high precision and recall.
作者 郑皎凌 王鹏
出处 《计算机工程》 CAS CSCD 北大核心 2010年第21期57-58,61,共3页 Computer Engineering
基金 国家自然科学基金资助项目(60702075)
关键词 Web站点核心逻辑结构 逻辑域 逻辑域核 导入路径 Website kernel logical structure logical domain logical domain core entry path
  • 相关文献

参考文献5

  • 1Crescenzi V.Discovering the Structure of Large Web Sites Valter Cresenzi[C]//Proc.of VLDB’01.Washington D.C.,USA: [s.n.],2001: 109-118.
  • 2Henzinger M R.Challenges in Web Search Engines[J].ACM SIGIR Forum.2002,36(2):11-23.
  • 3Sel?uk K,Li Wen-Syan.Reasoning for Web Document Associations and Its Applications in Site Map Construction[J].Data & Knowledge Engineering,2002,43(2): 121-150.
  • 4Li Wen-Syan.Defining Logical Domains in a Web Site[C]//Proc.of the 11th ACM Conference on Hypertext.San Antonio,USA: [s.n.],2000: 123-132.
  • 5Jon M.Kleinberg: Authoritative Sources in a Hyperlinked Environment[J].Journal of ACM.1999,46(5):604-632.

同被引文献6

引证文献1

  • 1转换路径[J].计算机光盘软件与应用(COMPUTER ARTS数码艺术),2008(3):106-106.

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部