期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究
被引量:
3
1
作者
乔建忠
《现代图书情报技术》
CSSCI
北大核心
2012年第6期9-16,共8页
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特...
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。
展开更多
关键词
相关性判断策略
主题爬行器
主题搜索
数字图书馆
原文传递
题名
一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究
被引量:
3
1
作者
乔建忠
机构
解放军艺术学院信息管理中心
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第6期9-16,共8页
文摘
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。
关键词
相关性判断策略
主题爬行器
主题搜索
数字图书馆
Keywords
relevance judgment strategy focused crawler focused crawling digital library
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究
乔建忠
《现代图书情报技术》
CSSCI
北大核心
2012
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部