中文文本情感词典构建方法被引量：37

Method on Building Chinese Text Sentiment Lexicon

下载PDF

导出

摘要互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。 Massive Internet text sentiment analysis is currently a hot research topic. This paper describes a method on Chinese text sentiment lexicon construction. This method improves the pointwise mutual information （PMI） algo- rithm for computing the weights of general sentiment lexicon, by selecting several sentiment seed words and drawing upon the total result numbers from search engine. In order to examine the validity of this method, this paper uses the established sentiment lexicon for text sentiment, and compares the classification effects of the method based on sentiment lexicon with those of na＇~ee Bayesian classifier. The experimental results indicate that the high-quality sentiment lexicon can effectively choose and classify the sentiment characteristics, and has a stable classification function.

作者阳爱民林江豪周咏梅

机构地区广东外语外贸大学思科信息学院广东外语外贸大学国际工商管理学院

出处《计算机科学与探索》 CSCD 2013年第11期1033-1039,共7页 Journal of Frontiers of Computer Science and Technology

基金国家社会科学基金项目教育部新世纪优秀人才支持计划教育部人文社会科学研究青年基金项目广东省科技计划项目广东省社科规划项目广东外语外贸大学校级项目广东外语外贸大学研究生科研创新项目~~

关键词情感词典情感分类 PMI算法朴素贝叶斯 sentiment lexicon sentiment classification pointwise mutual information （PMI） nalWe Bayes

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张剑峰,夏云庆,姚建民.微博文本处理研究综述[J].中文信息学报,2012,26(4):21-27. 被引量：55
2常晓龙,张晖.融合语素特征的中文褒贬词典构建[J].计算机应用,2012,32(7):2033-2037. 被引量：7
3林江豪,阳爱民,周咏梅,陈锦,蔡泽键.一种基于朴素贝叶斯的微博情感分类[J].计算机工程与科学,2012,34(9):160-165. 被引量：44
4柳位平,朱艳辉,栗春亮,向华政,文志强.中文基础情感词词典构建方法研究[J].计算机应用,2009,29(10):2875-2877. 被引量：85
5朱艳辉,栗春亮,徐叶强,柳位平.一种基于多重词典的中文文本情感特征抽取方法[J].湖南工业大学学报,2011,25(2):42-46. 被引量：10

二级参考文献88

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2黄永光,刘挺,车万翔,胡晓光.面向变异短文本的快速聚类算法[J].中文信息学报,2007,21(2):63-68. 被引量：17
3KU L-W, LO Y-S, CHEN H-H. Using polarity scores of words for sentence-level opinion extraction [ C]// Proceedings of the 6th NTCIR-6 Workshop Meeting. Toyko, Japan: [ s. n. ], 2007:316 - 322.
4王秉卿,张姝,张奇.中文情感词识别[C]//NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京:[出版社不详],2008:63-69.
5刘群李素建.基于《知网》的词汇语义相似度的计算.中文计算语言学,2002,17(2):59-76.
6王克,张春良,朱慕华,等.基于情感词词典的中文文本主客观分析[C].NCIRCS2008:第四届全国信息检索与内容安全学术会议.北京,2008.56-62.
7知网[EB/OL].[2009-03-12].http://www.keenage.com.
8TURNEY P D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews [ C]// Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics. Morristown, N J, USA: Association for Computational Linguistics, 2002:417-424.
9谭松波.中文情感挖掘语料-ChenSentiCorp[EB/OL].(2008-12-19)[2009-03-12].http://www.searchforum.org.cn/tansongbo/corpus-senti.htm.
10KAJI N, KITSUREGAWA M. Building lexicon for sentiment analysis from massive collection of HTML documents [ C/OL]//EMNLPCoNLL 2007: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. 2007:1075 - 1083 [2009 -03 -08]. http://www. aclweb. org/anthology/D/D07/D07-1115. pdf.

共引文献181

1王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
2王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
3杨鼎,阳爱民.一种基于情感词典和朴素贝叶斯的中文文本情感分类方法[J].计算机应用研究,2010,27(10):3737-3739. 被引量：44
4丁建立,慈祥,黄剑雄.网络评论倾向性分析[J].计算机应用,2010,30(11):2937-2940. 被引量：13
5朱艳辉,栗春亮,徐叶强,柳位平.一种基于多重词典的中文文本情感特征抽取方法[J].湖南工业大学学报,2011,25(2):42-46. 被引量：10
6何凤英.基于语义理解的中文博文倾向性分析[J].计算机应用,2011,31(8):2130-2133. 被引量：18
7魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：70
8金宇,朱洪波,王亚强,陈黎,于中华.基于直推式学习的中文情感词极性判别[J].计算机工程与应用,2011,47(34):164-167. 被引量：3
9陈虹.亚洲货币区再思考——兼论日元国际化[J].国际贸易,2000(2):54-57. 被引量：3
10林江豪,阳爱民,周咏梅,陈锦,蔡泽键.一种基于朴素贝叶斯的微博情感分类[J].计算机工程与科学,2012,34(9):160-165. 被引量：44

同被引文献487

1沈艳,陈赟,黄卓.文本大数据分析在经济学和金融学中的应用:一个文献综述[J].经济学（季刊）,2019,18(4):1153-1186. 被引量：86
2刘博,彭凯越,唐晓彬.基于互联网大数据背景下的CPI预测研究[J].经济统计学（季刊）,2018,0(1):104-117. 被引量：2
3峻冰.中国电影评论的现状及未来[J].电影文学,2006(11):8-10. 被引量：5
4付华,张方芳.浅谈大事记的写法[J].东疆学刊,1998,15(4):97-97. 被引量：1
5董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
6祝建华.控制实验——传播学研究方法之三[J].新闻大学,1986(12):98-101. 被引量：5
7祝建华.实地调查——传播学研究方法之一[J].新闻大学,1985(9):82-85. 被引量：3
8祝建华.内容分析——传播学研究方法之二[J].新闻大学,1985(10):97-100. 被引量：16
9于留宝,胡长军,苏林晗.基于MapReduce的微博文本采集平台[J].计算机科学,2012,39(S3):143-145. 被引量：5
10毛东武.方志词语运用种种[J].黑龙江史志,1996,0(3):13-19. 被引量：1

引证文献37

1孙波,陈玖冰,刘永娜.大数据背景下的学生情感词典构建方法[J].北京师范大学学报（自然科学版）,2015,51(4):358-361. 被引量：4
2邓松,万常选,关爱浩,陈辉.基于行为与内容的科技产品虚假评论识别[J].小型微型计算机系统,2015,36(11):2498-2503. 被引量：4
3王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：70
4邓松.实体信息集成检索的深网数据源选择[J].计算机工程,2016,42(10):75-79. 被引量：2
5彭德焰,胡欣宇.基于SVM的产品评论情感分析系统的设计与实现[J].物联网技术,2016,6(11):76-79. 被引量：2
6吴应良,黄媛,王选飞.在线中文用户评论研究综述:基于情感计算的视角[J].情报科学,2017,35(6):159-163. 被引量：17
7张华平,李恒训,李清敏.情感词发现与极性权重自动计算算法研究[J].中文信息学报,2017,31(3):48-54. 被引量：8
8代江波,毛建华,延丰,刘学锋.基于TA和SA的股价预测系统的实现[J].电子测量技术,2017,40(8):53-57.
9陈娟,刘燕平,邓胜利.政府辟谣信息的用户评论及其情感倾向的影响因素研究[J].情报科学,2017,35(12):61-65. 被引量：18
10李继东,王移芝.基于扩展词典与语义规则的中文微博情感分析[J].计算机与现代化,2018(2):89-95. 被引量：13

二级引证文献318

1孙星恺,王晓,陆浩.面向活动的网络媒体监测与建模分析:IVFC案例解析[J].智能科学与技术学报,2019,1(4):352-368. 被引量：1
2刘璐,张小明.白银景泰“5·22”黄河石林百公里越野赛舆情情感分析:基于新浪微博的研究[J].中国应急管理科学,2022(2):91-104. 被引量：1
3杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
4侯雪亮,李新,陈远平.基于多神经网络混合的短文本分类模型[J].计算机系统应用,2020(10):9-19. 被引量：5
5彭凡会.美食类短视频弹幕中用户情感体验分析——基于B站美食短视频账号“绵羊料理”的文本分析[J].新媒体研究,2023,9(6):28-32. 被引量：2
6杨倩,刁雅静,李家明,葛世伦.基于弹幕的参与式网站用户交互体验研究[J].知识管理论坛,2022(4):417-430. 被引量：1
7江进德,张玉可.皖北乡村旅游的情感特征及其影响因素分析[J].商丘师范学院学报,2023,39(6):64-69.
8曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：7
9包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
10陈清化,薛书琦,龚壮壮,曹润康.基于文本挖掘的物流服务水平评价方法[J].计算机应用,2023,43(S01):88-94.

1王丽,韩习武.双语词典在统计机器翻译中的应用[J].计算机工程与应用,2010,46(16):135-139.
2吴青林,王焱.中文微博情感特征选择方法研究[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(1):84-88. 被引量：2
3王杰群,马磊.一种改进的遗传算法在情感特征选择中的应用[J].电脑知识与技术（过刊）,2009,15(8X):6517-6519.
4周剑峰,阳爱民,周咏梅,王璇璇.基于二元搭配词的微博情感特征选择[J].计算机工程,2014,40(6):162-165. 被引量：6
5孙瑜.电子词典在中学英语中的应用[J].科学咨询,2016,0(47):81-81.
6张素智,孙培锋.基于KSVM的网络评论情感分类研究[J].郑州轻工业学院学报（自然科学版）,2011,26(3):1-4. 被引量：1
7张森,曹晖.基于《知网》概念定义的情感词典构建研究[J].计算机工程与应用,2015,51(17):118-123. 被引量：1
8魏治宇.新型嵌入式工业网络节点的设计[J].中国科技信息,2006(19):143-146.
9龙珑,邓伟.绿色网络博文倾向性分析算法研究[J].计算机应用研究,2013,30(4):1095-1098. 被引量：1
10潘永湘,屈省源,林遂芳.一种基于小波网络模型参考自适应控制系统的设计与应用[J].系统仿真学报,2004,16(11):2587-2590. 被引量：3

计算机科学与探索

2013年第11期

浏览历史

内容加载中请稍等...

中文文本情感词典构建方法被引量：37

参考文献5

二级参考文献88

共引文献181

同被引文献487

引证文献37

二级引证文献318

相关作者

相关机构

相关主题

浏览历史

中文文本情感词典构建方法 被引量：37

参考文献5

二级参考文献88

共引文献181

同被引文献487

引证文献37

二级引证文献318

相关作者

相关机构

相关主题

浏览历史

中文文本情感词典构建方法被引量：37