期刊文献+

基于本体的气象领域聚焦爬虫

下载PDF
导出
摘要 本文提出了基于本体的气象领域聚焦爬虫,首先利用Protégé工具构建气象领域本体,将本体作为领域知识库引入到聚焦爬虫中,然后,利用本体中的概念和概念关系判断所抓取的网页是否与气象领域相关,大大提高了抓取相关网页的准确度。最后,通过实验对整个爬虫进行验证。实验结果表明,本文所提出的实现方法在抓取气象领域网页信息方面是有效的。
作者 杨志伟 王鑫
出处 《中国管理信息化》 2011年第4期60-63,共4页 China Management Informationization
  • 相关文献

参考文献8

  • 1周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量:154
  • 2袁津生,李群,蔡岳.搜索引攀原理与实践[M].北京:北京邮电出版社,2008.
  • 3范黎林,王晓东,屈喜龙.基于Ontology知识库系统建模[J].计算机应用研究,2006,23(5):134-136. 被引量:8
  • 4汪方胜,侯立文,蒋馥.领域本体建立的方法研究[J].情报科学,2005,23(2):241-244. 被引量:43
  • 5欧健文,董守斌,蔡斌.模板化网页主题信息的提取方法[J].清华大学学报(自然科学版),2005,45(S1):1743-1747. 被引量:70
  • 6T Joachims.A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization[C]//Proceedings of the 14th International Conference on Machine Iearning,1997:143-151.
  • 7Arvind Arasu,Jasmine Novak.PageRank Computation and the Structure of the Web:Experiments and Algorithms[C]//Proceedings of the 11th International Conference on World Wide Web,Beijing,2002:221-241.
  • 8R Lempel,S Moran.SAISA:The Stochastic Approach for ISnk-Structure Analysis[J].ACM Transactions.Information Systems (TOIS),2001,19(2):131-160.

二级参考文献47

共引文献268

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部