期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于改进BFS算法的主题搜索技术研究
被引量:
1
1
作者
乔建忠
《现代图书情报技术》
CSSCI
北大核心
2013年第7期28-35,共8页
通过对Web主题爬行器在预测链接优先级时所用到的特征因子的细化和重新分类,引入收割率和媒体类型两个新特征作为相关性判断依据,提出一种改进的最好优先搜索算法。该算法采用"细粒度"策略过滤不相关网页,选取多个角度有代表...
通过对Web主题爬行器在预测链接优先级时所用到的特征因子的细化和重新分类,引入收割率和媒体类型两个新特征作为相关性判断依据,提出一种改进的最好优先搜索算法。该算法采用"细粒度"策略过滤不相关网页,选取多个角度有代表性的特征因子构造链接优先级计算公式,以达到全面揭示和预测链接主题的目的。通过与其他三类主题搜索算法的小规模实验比较,证明改进算法在收割率和平均提交链接数上效果较好。
展开更多
关键词
主题
搜索
搜索算法
最好优先搜索算法
主题爬行器
特征因子
原文传递
题名
一种基于改进BFS算法的主题搜索技术研究
被引量:
1
1
作者
乔建忠
机构
解放军艺术学院信息管理中心
出处
《现代图书情报技术》
CSSCI
北大核心
2013年第7期28-35,共8页
文摘
通过对Web主题爬行器在预测链接优先级时所用到的特征因子的细化和重新分类,引入收割率和媒体类型两个新特征作为相关性判断依据,提出一种改进的最好优先搜索算法。该算法采用"细粒度"策略过滤不相关网页,选取多个角度有代表性的特征因子构造链接优先级计算公式,以达到全面揭示和预测链接主题的目的。通过与其他三类主题搜索算法的小规模实验比较,证明改进算法在收割率和平均提交链接数上效果较好。
关键词
主题
搜索
搜索算法
最好优先搜索算法
主题爬行器
特征因子
Keywords
Focused crawling
Search algorithm
Best - First Search algorithm
Focused crawler
Characteristic factor
分类号
G254 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于改进BFS算法的主题搜索技术研究
乔建忠
《现代图书情报技术》
CSSCI
北大核心
2013
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部