-
题名一种基于划分的周期性话题挖掘方法研究
- 1
-
-
作者
邓定胜
-
机构
四川民族学院计算机科学系
-
出处
《微型电脑应用》
2014年第8期21-26,共6页
-
文摘
周期性话题挖掘是目前数据挖掘领域的研究热点之一,针对当前绝大部分研究只限于时间序列数据库、无法直接应用于文本数据的不足,提出了一种基于划分的周期性话题挖掘方法(PTMP),首先,将话题划分为周期性话题、背景话题和突发性话题,然后,将每个周期性话题的时标分布建模为混合高斯分布,为了缓解背景噪声问题,通过均匀分布生成背景话题的时标,用高斯分布来生成突发话题的时标,然后通过将该混合模型根据时标文本数据进行调整,从而发现周期性话题及其时间分布。最后,收集了包括研讨会、DBLP和Flickr在内的多个代表性数据集,验证方法的有效性。
-
关键词
周期性话题
数据挖掘
混合高斯分布
噪声
时标
-
Keywords
Periodic Topic
Data Ming
Mixture of Gaussian Distributions
Noise
Time-Stamps
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-