期刊文献+

基于LDA的中国少数民族网络舆情监测系统的探究

LDA inquiry-based Chinese minority network public opinion monitoring system
下载PDF
导出
摘要 随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。 With the development of ethnic areas of information technology, the Chinese minority language network public opinion research has gradually attracted everyone's attention, text classification and sentiment analysis module is an important part of public opinion of the system. Traditional text classification methods, mainly through word repetitions statistics literally, and semantic association little consideration for the text behind. This article focuses on the LDA model based on minority languages (with Yi for example) the application of information network public opinion sentiment analysis aspects of the theme of the text implied modeling, data mining minorities through public opinion on a web page that contains the theme, as well as sentiment analysis of these topics, before the incident broke out, Bian take emergency measures.
出处 《科技创新导报》 2014年第30期185-186,189,共3页 Science and Technology Innovation Herald
基金 国家自然科学基金"云南跨境民族网络舆情信息挖掘关键技术研究"(项目批准号61363085)项目 云南省重大项目"云南跨境民族语言网络敏感信息传播与分析-以彝文为例"项目(项目批准号ZD2013013) 云南省社会科学项目-云南跨境民族语言网络敏感信息传播与分析(项目批准号YB201152) 云南民族大学创新团队 云南省云南民族大学少数民族语言信息化处理研究中心资助
关键词 主题模型 网络舆情系统 情感分析 Topic model network public opinion the detection system
  • 相关文献

参考文献5

  • 1翁伟,王厚峰.基于LDA的关键词抽取方法[c]//第五届全国青年计算语言学研讨会论文集,2010.
  • 2周博,岑荣伟,刘奕群,张敏,金奕江,马少平.一种基于文档相似度的检索结果重排序方法[J].中文信息学报,2010,24(3):19-23. 被引量:9
  • 3C.C.Chang,C.J.Lin. LIBSVM a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology (TIST),2011,2(3)..27.
  • 4奉国和.文本分类性能评价研究[J].情报杂志,2011,30(8):66-70. 被引量:40
  • 5台湾大学NTUSD-简体中文情感极性词典[DB/OL].[2011-10-25].httP://www.datatang.com/data/11837.

二级参考文献50

  • 1宋枫溪,高林.文本分类器性能评估指标[J].计算机工程,2004,30(13):107-109. 被引量:33
  • 2程泽凯 ,林士敏 .文本分类器稳定性评估研究[J].情报学报,2005,24(1):64-68. 被引量:3
  • 3王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量:129
  • 4张启蕊,董守斌,张凌.文本分类的性能评估指标[J].广西师范大学学报(自然科学版),2007,25(2):119-122. 被引量:7
  • 5搜狐研发中心.搜狗文本分类语料库[EB/OL].2008.http://www.sogou.oom/labs/dl/c.html.
  • 6Jinxi,X.,W.B.Croft.Improving the effectiveness of information retrieval with local context analysis[J].ACM Trans.Inf.Syst.,2000,18(1):79-112.
  • 7Gerard,S..Automatic text processing:the transfor-mation,analysis,and retrieval of information by computer[M].Addison-Wesley Longman Publishing Co.,Inc.1989:78-99.
  • 8Kamps,J..Improving Retrieval Effectiveness by Reranking Documents Based on Controlled Vocabulary[C]//Proceedings of the 21th European Conference on Information Retrieval,2004:283-295.
  • 9Qu,Y.L.,G.W.Xu,et al..Rerank Method Based on Individual Thesaurus[C]//Proceedings of NTCIR2 Workshop,2000:79-112.
  • 10Bodo,B.,Z.Justin.Questioning query expansion:an examination of behaviour and parameters[C]//Proceedings of the 15 th Australasian database conferenceVolume 27.Dunedin,New Zealand,Australian Computer Society Inc.,2004:69-76.

共引文献47

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部