期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究 被引量:2
1
作者 钱红兵 李艳丽 张蕊 《电子设计工程》 2019年第24期11-14,19,共5页
在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究... 在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究相关材料文献和技术文档,研究相关系统设计案例,结合实际情况设计和实现一个能运行的系统,得出基于Webcollector爬虫框架和ElasticSearch搜索引擎设计和实现网站群敏感词检测系统的可行性。 展开更多
关键词 webcollector ElasticSearch 敏感词检测 爬虫 搜索引擎
下载PDF
面向微博的网络爬虫数据采集 被引量:7
2
作者 于营 《信息系统工程》 2017年第12期36-37,共2页
本课题对新浪开放平台API进行了分析,由于新浪对开发平台API的调用的限制,我们选择使用WebCollector来爬取微博数据。本设计通过JAVA语言,实现了一个简单的爬虫程序,成功的爬取了指定微博用户下的微博数据。
关键词 微博 爬虫 webcollector
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部