-
题名一种基于PDBMLCA聚类的网络突发事件发现算法
- 1
-
-
作者
温源
王星
刘云
行新香
-
机构
北京交通大学通信与信息系统北京市重点实验室
中国信息安全测评中心
-
出处
《北京交通大学学报》
CAS
CSCD
北大核心
2013年第2期63-67,共5页
-
基金
国家自然科学基金资助项目(60972012,61271308)
北京市自然科学基金资助项目(4112045)
+1 种基金
高等学校博士学科点专项科研基金资助(W11C100030)
北京市科技计划资助项目(Z121100000312024)
-
文摘
针对目前网络信息爆炸式发展的状况下,需要及时了解和掌握网上重要信息及追踪网络事件进展,给出了一种突发事件发现算法.该算法通过引入文本词语的突发度量值,考虑位置对词语权重影响等因素,提高了计算权重值的准确度.根据基于预设密度的最大链路算法,在平均半径的范围内,满足一定条件的文本集合连成一条链路,进而形成一个类簇相似的文本以类簇为类.该聚类算法在结合突发值及位置影响等因素下,能够合理的划分一段时期内的文本并归属相应的主题.实验结果表明,该算法在发现突发事件中有较好的效果.
-
关键词
自然语言
聚类
突发事件
权重
-
Keywords
natural language
clustering
bursty event
weighting
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-