期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Web新闻自动采集发布系统的设计与实现 被引量:7
1
作者 张春元 康耀红 伍小芹 《计算机技术与发展》 2009年第9期250-252,F0003,共4页
针对新闻网站通过人工方式采集发布来自其它网站的Web新闻费时费力、易重采与漏采这一问题,综合运用Web信息采集技术、网页去噪技术、文本文档消重技术以及文本自动分类技术设计并实现了一种基于网络爬虫的Web新闻自动采集发布系统。在... 针对新闻网站通过人工方式采集发布来自其它网站的Web新闻费时费力、易重采与漏采这一问题,综合运用Web信息采集技术、网页去噪技术、文本文档消重技术以及文本自动分类技术设计并实现了一种基于网络爬虫的Web新闻自动采集发布系统。在给出系统总体结构的基础上,对其各个模块的功能、设计与实现方法进行了详细介绍。实验表明,该系统设计合理,具有采集效率高、消重准确、集成方便、运行费用低等优点,可作为新闻网站的采编工具加以推广使用。 展开更多
关键词 网络爬虫 网页去噪 文档消重 Web新闻发布
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部