基于多特征融合的汉语情感分类研究被引量：6

Classification approach of Chinese texts sentiment based on integrated features

下载PDF

导出

摘要中文情感分类一般分成基于情感词典和基于特征分类两种方法进行研究,但没有考虑过将两种方法得到的特征进行融合来提高分类效果。基于特征分类的方法忽视了特征词在情感词典的褒贬性以及词倾向性的强弱。用基于特征分类方法得到的文本特征建立朴素贝叶斯模型,根据特征词在情感词典中的褒贬性及其通过点对互信息方法得到的词性强弱调整情感词的正负后验概率权重,实现两种特征的融合,提高分类效果并降低了特征维数。 Generally the approach of Chinese text sentiment classification was based on the sentiment lexicon or the feature-selection,rather than the integration of the both involved to improve the classification effects.Feature-selection method ignored the emotional tendencies and value of words in the sentiment dictionary.This paper adopted the feature from the method of feature-selection to construct the naive Bayesian model,according to the emotional tendency of the feature in the sentiment dictionary and its value from point mutual information.And adjusted the weights of the positive and negative emotion word posterior probability to achieve the integration,improved the classification results and reduced the feature dimension.

作者钟将邓时滔

机构地区重庆大学计算机学院

出处《计算机应用研究》 CSCD 北大核心 2012年第1期98-100,共3页 Application Research of Computers

基金国家"211工程"三期建设项目(S-10218)

关键词文本情感分类情感词典点对互信息特征选择朴素贝叶斯 text sentiment classification semantic lexicon point wise mutual information feature-selection naive Bayesian

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：546
2HU Ming-qing, LIU Bing. Mining and summarizing customer reviews [ C]//Proc of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2004 : 168-177.
3王素格,杨安娜,李德玉.基于汉语情感词表的句子情感倾向分类研究[J].计算机工程与应用,2009,45(24):153-155. 被引量：34
4PANG Bo, LEE L, VAITHYANATHAN S. Thumbs up? sentiment classification using machine learning techniques [ C ]//Proc of Conference on Empirical Methods in Natural Language Processing. 2002: 79- 86.
5王素格,魏英.停用词表对中文文本情感分类的影响[J].情报学报,2008,27(2):175-179. 被引量：22
6知网[EB/OL].[2009-03-12].http://www.keenage.com.
7YANG Yi-ming, PEDERSEN J O. A comparative study on feature selection in text categorization[ C]//Proc of the 14th International Conference on Machine Learning. San Francisco:Morgan Kaufmann Publisher, 1997 : 412-420.
8唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：136
9谭松波.中文情感挖掘语料ChenSentiCorp[EB/OL](2010-06-29)[2011-04-22].http://www.searchforumrg.en/tan-songbo/corpus-senti.htm.

二级参考文献38

1顾益军,樊孝忠,王建华,汪涛,黄维金.中文停用词表的自动选取[J].北京理工大学学报,2005,25(4):337-340. 被引量：35
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
3Wiebe J,Wilson T,Bruce R,et al.Learning subjective language[J]. Computational Linguistics, 2004,30(3 ) : 277-308.
4Yu Hong,Hatzivassiloglou V.Towards answering opinion questions[C]// Proceeding of EMNLP, 2003.
5Yi J,Nasukawa T,Bunescu R,et al.Sentiment analyzer:Extracting sentiments about a given topic using natural language processing techniques[C]//Proceeding of the Third IEEE International Conference on Data Mining,2003.
6Hu Ming--qing,Liu BingaMining and summarizing customer reviews[C]// Proceedings of the Tenth ACM SIGKDD,2004:168-177.
7Wang Chao,Lu Jie,Zhang Guang-quan.A semantic classification approach for online product reviews[C]//Proceedings of the 2005 IEEE/WIC/ACM International Conference on Web Intelligence(W/' 5) ,2005.
8HowNet[R/OL].HowNet's Home Page.http://www.keenage.com.
9王根,赵军.基于多重冗余标记CRFs的句子情感分析研究[J].中文信息学报,2007,21(5):51-55. 被引量：32
10Franco Salvetti, Stephen Lewis, Christoph Reichenbach. Automatic Opinion Polarity Classification of Movie Reviews[J]. Colorado Research in Linguistics, 2004, Volume 17, Issue 1.

共引文献697

1包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：6
2王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
3王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：20
4刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
5徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：3
6杨梦月,卫伟,陆慧娟,卢海峰.基于差分进化的中文情感分类集成算法研究[J].计量学报,2020,41(2):225-230. 被引量：2
7张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29. 被引量：2
8安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
9蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.
10何忠育,王勇,王瑛,陈新,廖朝辉.基于分布式计算的网络舆情分析系统的设计[J].警察技术,2010(3):19-22. 被引量：6

同被引文献75

1李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：903
2李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量：1262
3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
4俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
5胡熠,陆汝占,李学宁,段建勇,陈玉泉.基于语言建模的文本情感分类研究[J].计算机研究与发展,2007,44(9):1469-1475. 被引量：23
6http://www.csie.ntu.edu.tw/-cjlin/libsvm/.
7知网[EB/OL].[2007-09-03].http://www.keenage.com.
8WANG Su-ge, LI De-yu, SONG Xiao-lei, et al. A feature selection method based on improved fisher' s discriminant ratio for text senti- ment classification[ J ]. Expert Systems with Applications, 2011, 38(7) :8696-8702.
9PANG B, LEE L. Opinion mining and sentiment analysis[ J]. Foun- dations and Trends in Information Retrieval, 2008,2 ( 1 ) : 1-135.
10ZHAI Zhong-wu, XU Hua, KANG Ba-da, et al. Exploiting effective features for Chinese sentiment classification [ J ]. Expert Systems with Applications, 2011,38(8) :9139-9146.

引证文献6

1甘小红,张兆年.基于多特征融合的中文情感分类方法研究[J].图书情报工作,2012,56(21):109-113.
2刘智,杨宗凯,刘三(女牙),铁璐.一种基于样本空间动态划分的中文情感识别方法[J].计算机应用研究,2013,30(5):1443-1447. 被引量：1
3杜思奇,李红莲,吕学强.基于汉语组块分析的情感标签抽取[J].情报理论与实践,2016,39(5):125-129. 被引量：4
4杜思奇,李红莲,吕学强.汉语组块分析在情感分类中的应用研究[J].计算机应用与软件,2016,33(10):167-171.
5邢玉娟.基于混合特征云向量模型和SVM的文本情感分类[J].宁夏大学学报（自然科学版）,2017,38(1):69-73. 被引量：1
6于千惠,张绪霞,高洪雨,战杰.基于预训练融合模型的高校网络舆情分析研究[J].山东电力高等专科学校学报,2023,26(1):52-55.

二级引证文献6

1王庚福.中文情感分析综述[J].电脑知识与技术,2016,0(6):133-134.
2赵冬晓,王效岳,白如江,刘自强.面向情报研究的文本语义挖掘方法述评[J].现代图书情报技术,2016(10):13-24. 被引量：7
3李良强,李开明,白梨霏,曹云忠,吴亮.网购农产品评论中的消费者情感标签抽取方法研究[J].电子科技大学学报（社科版）,2018,20(4):1-7. 被引量：1
4苏灵松,应捷,杨海马,肖昊琪.双通道卷积记忆神经网络文本情感分析[J].软件导刊,2019,18(7):32-36. 被引量：5
5邱泽国,贺百艳.基于文本挖掘的网络舆情主题发现与情感分析[J].对外经贸,2021(2):76-79. 被引量：3
6邱桂华,李贤阳,肖宝,阳建中.一种基于智能组卷的试题库随机分段抽题算法[J].北部湾大学学报,2020,35(11):31-35. 被引量：4

1徐照松,元建.基于BP神经网络的语音情感识别研究[J].软件导刊,2014,13(4):11-13. 被引量：6
2李书玲,刘蓉,张鎏钦,刘红.基于改进型SVM算法的语音情感识别[J].计算机应用,2013,33(7):1938-1941. 被引量：22
3廖勇军,杨丹,张小洪.基于最大特征点对互信息的图像配准[J].计算机应用研究,2008,25(3):939-941. 被引量：9
4缑葵香,宫秀军,冉勇.基于模型融合的分布式贝叶斯网络学习算法[J].计算机应用研究,2010,27(1):60-63.
5李锋,俞能海,郑裕峰,陈羽中.移动自组网中一种新颖的基于概率权重的门限签名方案[J].电路与系统学报,2007,12(3):107-111.
6张慧,王中卿,李寿山,杨欣欣,李培峰,朱巧明.基于状态和行为描述的情感分类方法[J].计算机工程,2012,38(8):147-149.
7陈炜亮,孙晓.基于MFCCG-PCA的语音情感识别[J].北京大学学报（自然科学版）,2015,51(2):269-274. 被引量：16
8王中卿,李寿山,朱巧明,李培峰,周国栋.基于不平衡数据的中文情感分类[J].中文信息学报,2012,26(3):33-37. 被引量：11
9梁坤,古丽拉·阿东别克.基于SVM的中文新闻评论的情感自动分类研究[J].电脑知识与技术,2009,5(5):3496-3498. 被引量：4
10徐健锋,许园,许元辰,张远健,刘清.基于语义理解和机器学习的混合的中文文本情感分类算法框架[J].计算机科学,2015,42(6):61-66. 被引量：29

计算机应用研究

2012年第1期

浏览历史

内容加载中请稍等...

基于多特征融合的汉语情感分类研究被引量：6

参考文献9

二级参考文献38

共引文献697

同被引文献75

引证文献6

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多特征融合的汉语情感分类研究 被引量：6

参考文献9

二级参考文献38

共引文献697

同被引文献75

引证文献6

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多特征融合的汉语情感分类研究被引量：6