期刊文献+

基于新词识别的大数据聊天文本舆情热点挖掘 被引量:1

下载PDF
导出
摘要 热点是在一段时间内用户文本涉及最多的热议焦点。大数据聊天文本的研究可以帮助用户及时了解当下文本热点话题和热门事件,帮助企业了解和评测用户关心的热点,且使得对社会舆情热点有明确的方向把握。因此对大数据聊天文本的研究有广泛的适用性和研究价值。由于聊天文本自由度大、语法不规范、即时性强大特点,引擎通过传统的文本分析难以对微博热点进行准确的把握。本文中通过对一个时间跨度的文本特征进行处理,通过加入跨度的时间信息来决策是否为热点词。通过实验,挖掘出的热点词与相应的热点事件相对应,说明本文提出的方法有不错的使用效果,可以进行更深入的研究。
出处 《电子商务》 2018年第1期60-61,共2页 E-Business Journal
  • 相关文献

参考文献3

二级参考文献38

  • 1欧健文,董守斌,蔡斌.模板化网页主题信息的提取方法[J].清华大学学报(自然科学版),2005,45(S1):1743-1747. 被引量:70
  • 2周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量:154
  • 3Jianping Zeng,Shiyong Zhang,Chengrong Wu,Jianfeng Xie.Predictive Model for Internet Public Opinion.IEEE. Vol.3,pp.7- 11,2007.
  • 4P.D.Turney,M.L.Littman.Unsupervised learning of semantic orientation from a hundred-billion-word corpus.Technical Report ERB-1094,National Research Council Canada,Institute for Information Technology,2002.
  • 5Fuchun Peng, Fangfang Feng.PAndrew McCallum. Chinese segmentation and new word detection using conditional random fields. ACM,pp. 562 - es,2004.
  • 6PYanjun Li,Soon M. Chung,John D. Holt. Text document clustering based on frequent word meaning sequences.ACM,pp.381- 404,2008.
  • 7Pieter N, Michiel H. Mining Twitter in the cloud: A case study [C]// Proceedings of the 2010 IEEE 3rd International Conference on Cloud Computing, CLOUD 2010. Miami, USA: IEEE Computer Society, 2010: 107 -114.
  • 8Abraham R, Martinez T. Twitter: Network properties analysis [C]// Proceedings of the CONIELECOMP 2010 20th International Conference on Electronics Communications and Computers. Cholula Puebla, Mexico: IEEE Computer Society, 2010: 180 - 184.
  • 9wenE,SunV.新浪微博研究报告[Z/OL].(2011-05-20),http://www.techweb.com.cn/data/2011-02-25/916941.shtml.
  • 10HAN Ruixia. The influence of microblogging on personal public participation [C]// Proceedings of the 2010 IEEE 2nd Symposium on Web Society, SWS 2010. Beijing, China: Association for Computing Machinery, 2010:615 -618.

共引文献135

同被引文献11

引证文献1

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部