期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于在线增量学习的自适应聚焦爬虫研究 被引量:2
1
作者 朱婷 滕桂法 +2 位作者 陆浩 张长利 曾大军 《计算机应用与软件》 CSCD 2009年第5期25-27,33,共4页
在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适... 在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适应链接分类器能即时根据爬虫爬得网页和网页链接信息作出分类模型调整以更合理方式计算链接的主题相关度。系统中链接排序模块采用TopicalRank主题相关度计算方法分析链接优先抓取顺序。把基于增量学习的自适应聚焦爬虫应用到农业领域,实验结果和分析证明在线增量学习的自适应聚焦爬虫在农业领域爬行性能比仅基于网页相关性和链接重要度的原始分类器聚焦爬虫具有更好的性能。 展开更多
关键词 在线增量学习 topicalrank 聚焦爬虫 农业领域
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部