-
题名基于LDA模型和AP聚类的主题演化分析
被引量:7
- 1
-
-
作者
倪丽萍
刘小军
马驰宇
-
机构
合肥工业大学管理学院
教育部过程优化与智能决策重点实验室
-
出处
《计算机技术与发展》
2016年第12期6-11,共6页
-
基金
国家自然科学青年基金(71301041
71271071)
-
文摘
随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管控。针对单个主题演化分析方法中阈值设定和主题漂移的问题,提出一种LDA-AP主题演化模型。该方法利用LDA模型对不同时间窗口内的新闻文本分别进行建模,得到相应的主题。利用AP聚类算法对不同时间窗口内的多个主题进行聚类,其中计算主题相似度采用加入时间衰减因子的JS散度来度量。最后对多个主题内容进行演化分析。通过相关的实验分析和对比,结果表明该方法可以改善主题演化的性能,并能较好地分析多个新闻主题事件随时间的演化趋势。
-
关键词
多主题演化
时间窗口
LDA模型
AP聚类算法
JS散度
-
Keywords
multiple topic evolution
time window
LDA model
AP clustering algorithm
JS distance
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-