期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向大规模数据的在线新事件检测
被引量:
1
1
作者
蔡偃武
高大启
+1 位作者
阮彤
蒋锐权
《计算机工程》
CAS
CSCD
2014年第10期37-42,共6页
通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比...
通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。
展开更多
关键词
新事件检测
单路径聚类
大规模数据
并行计算
倒排索引
MapReduce架构
下载PDF
职称材料
题名
面向大规模数据的在线新事件检测
被引量:
1
1
作者
蔡偃武
高大启
阮彤
蒋锐权
机构
华东理工大学计算机科学与工程系
上海证券交易所技术开发部
出处
《计算机工程》
CAS
CSCD
2014年第10期37-42,共6页
基金
国家科技支撑计划基金资助项目"证券业云平台研发与运营"(2012BAH13F02)
文摘
通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。
关键词
新事件检测
单路径聚类
大规模数据
并行计算
倒排索引
MapReduce架构
Keywords
New Event Detection (NED)
single-pass clustering
large-scale data
parallel computing
inverted index
MapReduce architecture
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向大规模数据的在线新事件检测
蔡偃武
高大启
阮彤
蒋锐权
《计算机工程》
CAS
CSCD
2014
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部