期刊文献+

面向主题网络爬行的智能隧道穿越算法研究 被引量:6

Focused crawling oriented intelligent tunneling algorithm research
下载PDF
导出
摘要 在深入研究传统的主题网络爬虫爬行策略的基础上,提出了一种全新的智能隧道穿越算法。该算法将快速在线Q(λ)学习算法引入普通隧道技术中,通过在线学习积累爬行过程中的经验,引导主题网络爬虫以最小的时空代价穿越主题相关度低的区域到达主题相关度高的区域。模拟实验表明,与普通隧道相比,智能隧道算法降低了时空复杂度,提高了主题网络爬虫的性能与运行效率。 This paper proposed a new intelligent tunneling algorithm based on deep research on traditional focused crawling strategy. This algorithm combined with tunneling technology and fast online Q ( A ) learning and led focused crawler to go through from low relevant areas to high ones with the smallest cost by online learning and experience accumulation. In the simulation experiment, compared intelligent tunneling algorithm with normal tunneling, the result shows that the intelligent tunneling algorithm has reduced the time space complexity and improves performance and increases efficiency of focused crawler.
出处 《计算机应用研究》 CSCD 北大核心 2009年第8期2931-2933,共3页 Application Research of Computers
关键词 主题网络爬虫 爬行策略 隧道 在线学习 马尔可夫 focused crawler focused crawling strategy tunneling online learning Markov
  • 相关文献

参考文献2

  • 1Marco Wiering,Jürgen Schmidhuber. Fast Online Q(λ)[J] 1998,Machine Learning(1):105~115
  • 2Jing Peng,Ronald J. Williams. Incremental multi-step Q-learning[J] 1996,Machine Learning(1-3):283~290

同被引文献53

引证文献6

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部