期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
可动态自适应主题爬虫的研究
1
作者 肖新凤 余伟 +3 位作者 李石君 陈亚辉 刘倍雄 刘永明 《计算机与数字工程》 2019年第5期1151-1159,共9页
针对传统的主题爬虫在面对动态变化的互联网时存在着主题知识涵盖不全、领域知识更新以及主题资源中心转移等问题。论文提出了一种可动态自适应互联网信息的主题爬虫。其中,可动态选择种子URL的TopicHub算法,相比于传统的静态种子URL的... 针对传统的主题爬虫在面对动态变化的互联网时存在着主题知识涵盖不全、领域知识更新以及主题资源中心转移等问题。论文提出了一种可动态自适应互联网信息的主题爬虫。其中,可动态选择种子URL的TopicHub算法,相比于传统的静态种子URL的主题爬虫,抓取效率提升了7%以上,查全率提升了5%以上。另外,针对于静态本体库所存在的主题信息涵盖不全、领域知识变化更新等问题,提出了一种可动态扩充领域语义信息的结合静态本体库和动态语义的主题算法简称为SDTP算法。相比于传统的基于静态本体库的算法查准率提升了13%,相比于基于向量空间模型VSM的算法提升了4%。 展开更多
关键词 主题爬虫 动态自适应 url图结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部