期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Nutch的多源社交媒体情报采集系统 被引量:1
1
作者 傅魁 覃桂双 《北京邮电大学学报(社会科学版)》 2019年第5期85-92,共8页
以新闻、论坛、贴吧、微博等互联网社交媒体平台为研究对象,在对各平台进行领域建模、情报采集流程设计以及采集内容解析的基础上,设计了基于网络抓取开源工具Nutch的通用采集系统。根据各平台特点,分别将分类排名、分块解析、模拟登录... 以新闻、论坛、贴吧、微博等互联网社交媒体平台为研究对象,在对各平台进行领域建模、情报采集流程设计以及采集内容解析的基础上,设计了基于网络抓取开源工具Nutch的通用采集系统。根据各平台特点,分别将分类排名、分块解析、模拟登录方法应用于新闻、论坛贴吧、微博的采集工作中,以提高系统的通用性和性价比,实现对多源社交媒体情报的高效采集。 展开更多
关键词 NUTCH 社交媒体情报 多源情报采集 内容解析 模拟登录
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部