摘要
随着互联网的飞速发展,网络舆情引发的问题也越发突出。尤其是近年来发生的新疆暴恐事件,已成为公众关注的焦点。主题演化是网络舆情分析的重要内容之一,为了把握关于新疆的舆情动态,该文从主题热度变化、内容变化及关键词等多方面进行了研究。该文首先抓取了2013年1月到2015年12月互联网中关于新疆暴恐事件的新闻,并以此作为数据集建立了动态主题模型,实现对新闻的主题演化分析。该模型采用两次非负矩阵分解来生成主题,以层级式狄利克雷过程为对比实验,通过可视化分析与比较,总结出新疆暴恐事件的一些规律。
With the explosive growth of networks,the internet public opinion becomes a non-negligible issue.A typical example is focus on the events about Xinjiang Violence happened in recent years.In order to examine the corresponding public opinion trends,this paper investigates the key words of topic and the change of both topic strength and its content.On the crawled news about Xinjiang Violence from 2013.01 to 2015.12,we apply the dynamic topic model(DTM)which generate topics by applying NMF twice.Compared to HDP,we reveal some properties by visualized analysis.
作者
张绍武
邵华
林鸿飞
杨亮
ZHANG Shaowu;SHAO Hua;LIN Hongfei;YANG Liang(Dalian University of Technology,Institute of Computer Science and Technology,Dalian,Liaoning 116024,China;Xinjiang University of Finance and Economics,Institute of Computer Science and Engineering,Urumqi,Xinjiang 830013,China)
出处
《中文信息学报》
CSCD
北大核心
2018年第5期105-113,共9页
Journal of Chinese Information Processing
基金
国家自然科学基金(61562080
71561025
61632011)