期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于统计特征面向“类型”主题抓取的网页相关性判断策略研究 被引量:3
1
作者 乔建忠 《现代图书情报技术》 CSSCI 北大核心 2012年第6期9-16,共8页
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特... 为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。 展开更多
关键词 相关性判断策略 主题爬行器 主题搜索 数字图书馆
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部