期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于在线增量学习的自适应聚焦爬虫研究
被引量:
2
1
作者
朱婷
滕桂法
+2 位作者
陆浩
张长利
曾大军
《计算机应用与软件》
CSCD
2009年第5期25-27,33,共4页
在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适...
在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适应链接分类器能即时根据爬虫爬得网页和网页链接信息作出分类模型调整以更合理方式计算链接的主题相关度。系统中链接排序模块采用TopicalRank主题相关度计算方法分析链接优先抓取顺序。把基于增量学习的自适应聚焦爬虫应用到农业领域,实验结果和分析证明在线增量学习的自适应聚焦爬虫在农业领域爬行性能比仅基于网页相关性和链接重要度的原始分类器聚焦爬虫具有更好的性能。
展开更多
关键词
在线增量学习
topicalrank
聚焦爬虫
农业领域
下载PDF
职称材料
题名
基于在线增量学习的自适应聚焦爬虫研究
被引量:
2
1
作者
朱婷
滕桂法
陆浩
张长利
曾大军
机构
河北农业大学信息科学与技术学院
中科院自动化所复杂系统与智能科学实验室
出处
《计算机应用与软件》
CSCD
2009年第5期25-27,33,共4页
基金
国家自然科学基金(60621001,6057378)
中国科学院海外合作伙伴计划项目(2F05N01)
文摘
在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适应链接分类器能即时根据爬虫爬得网页和网页链接信息作出分类模型调整以更合理方式计算链接的主题相关度。系统中链接排序模块采用TopicalRank主题相关度计算方法分析链接优先抓取顺序。把基于增量学习的自适应聚焦爬虫应用到农业领域,实验结果和分析证明在线增量学习的自适应聚焦爬虫在农业领域爬行性能比仅基于网页相关性和链接重要度的原始分类器聚焦爬虫具有更好的性能。
关键词
在线增量学习
topicalrank
聚焦爬虫
农业领域
Keywords
Online-Incremental learning
topicalrank
Focused crawler Agriculture field
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TB566 [交通运输工程—水声工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于在线增量学习的自适应聚焦爬虫研究
朱婷
滕桂法
陆浩
张长利
曾大军
《计算机应用与软件》
CSCD
2009
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部