期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向图书主题的爬虫算法研究 被引量:6
1
作者 张莉婧 曾庆涛 +2 位作者 李业丽 孙华艳 字云飞 《计算机科学》 CSCD 北大核心 2017年第B11期460-463,469,共5页
针对图书信息爬取结果中包含大量无用数据的问题,提出一种面向图书主题的爬虫算法。该算法主要由两部分组成:一部分是基于开放式分类目录系统(ODP)的动态关键词扩充的主题描述方法;另一部分是基于词项语义扩展度的向量空间模型(VSM)主... 针对图书信息爬取结果中包含大量无用数据的问题,提出一种面向图书主题的爬虫算法。该算法主要由两部分组成:一部分是基于开放式分类目录系统(ODP)的动态关键词扩充的主题描述方法;另一部分是基于词项语义扩展度的向量空间模型(VSM)主题相关度算法。通过实验对新算法、基于关键词的VSM算法以及基于ODP的VSM算法进行了对比分析,结果表明新算法在图书主题爬虫中更具有优势。 展开更多
关键词 主题爬虫 开放式分类目录系统 向量空间模型 语义扩展度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部