期刊文献+

基于VSM主题爬虫爬行策略的研究

下载PDF
导出
摘要 网络爬虫作为搜索引擎重要的组成部分,其抓取网页资源主题相关性的高低直接决定爬虫性能的好坏。文章在VSM模型的基础上引入关键词的同义、继承、属性等关系的相关词汇来增强VSM模型的语义,通过实验进行验证,改进能够取得较好的抓取效果。
作者 张锦 罗钊
出处 《信息通信》 2014年第2期37-38,共2页 Information & Communications
关键词 主题爬虫 爬行 VSM
  • 相关文献

参考文献3

二级参考文献4

  • 1张冬慧,孙波,徐照财,程显毅.文本自动分类关键技术研究[J].微计算机信息,2008,24(6):197-199. 被引量:12
  • 2Pangning Tan, Vipin Kumar.Modeling of Web Robot Navigational Patterns [A].Proceedings of the WebKDD2000: Web Mining for E-Commerce[C].Boston, USA: ACM Press, 2000.111-117.
  • 3David Hawking, Nick Craswell,Paul Thistlewaite. Results and Challenges in Web Search Evaluation [J].Elsevier North-Holland, 1999: 1321-1330.
  • 4O.W.Kwon,J.H.Lee.web page classification based on k-nearest neighbor approach [A].Proceedings of the fifth international workshop on information retrieval with Asian languages [C]. NewYork, USA: ACM Press, 2000.9-15.

共引文献12

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部