基于多特征融合的评论文本情感分析被引量：7

Comment Text Sentiment Analysis Based on Multi-feature Fusion

下载PDF

导出

摘要评论文本情感分析现已成为自然语言处理的重要研究领域。针对评论文本语法不规则、特征稀疏的问题,设计了一种针对评论文本的多特征融合的情感分类算法。首先提出一种改进的情感规则方法;然后从规则方法中提取出有效信息,将每一个情感信息量扩展为多维向量,再融合一元词特征、句法特征以及依存词语搭配特征构成向量空间,形成更有效的融合特征模板;最后利用信息增益理论进行特征选择,作为支持向量机的输入对评论文本进行识别和分类,实现了机器学习方法与规则方法相融合。以中文酒店评论数据集作为语料进行实验,结果表明该方法能让机器学习算法更加充分地利用规则特征,相比单纯地使用规则方法或机器学习方法,能够达到更好的分类性能,进一步提高分类精度。 The analysis on text emotional inclination has received much attention from natural language processing filed in recent years.In order to solve the problem of grammatical irregularity and feature sparsity,we design an emotional classification approach based on multi-feature fusion for text sentiment.At first,an improved method based on emotional rules is proposed.Then the effective information extracted from the ruled-based method is extended to a multidimensional vector and an effective integration feature set is obtained by adding various rule-based features to the basic feature set after expanding and converting them.Finally,the information gain theory is used to select features as the input of SVM.Thus,a method via a combination of rule-based and machine learning method is realized.We use the Chinese hotel reviews data set as the corpus for the experiment which shows that this method can make machine learning algorithm more full use of the rule features and it works better than simply using rule-based method or machine learning method.

作者龚安费凡 GONG An;FEI Fan(School of Computer ＆ Communication Engineering,China University of Petroleum,Qingdao 266580,Chin)

机构地区中国石油大学(华东)计算机与通信工程学院

出处《计算机技术与发展》 2018年第8期91-95,共5页 Computer Technology and Development

基金国家油气重大专项(2017ZX05013-001)

关键词文本情感分析多特征融合机器学习情感规则 text sentiment analysis multi-feature fusion machine learning emotional rules

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1董强柱.微博中的意见领袖和新闻伦理[J].长安大学学报（社会科学版）,2013,15(2):118-121. 被引量：5
2赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：541
3刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198

二级参考文献42

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2H Y Tan. Chinese place automatic recognition research. In: C N Huang, Z D Dong, eds. Proc of Computational Language.Beijing: Tsinghua University Press, 1999
3Zhang Huaping, Liu Qun, Zhang Hao, et al. Automatic recognition of Chinese unknown words recognition. First SIGHAN Workshop Attached with the 19th COLING, Taipei, 2002
4S R Ye, T S Chua, J M Liu. An agent-based approach to Chinese named entity recognition. The 19th Int'l Conf on Computational Linguistics, Taipei, 2002
5J Sun, J F Gao, L Zhang, et al. Chinese named entity identification using class-based language model. The 19th Int'l Conf on Computational Linguistics, Taipei, 2002
6Lawrence R Rabiner. A tutorial on hidden Markov models and selected applications in speech recognition. Proc of IEEE, 1989,77(2): 257～286
7Shai Fine, Yoram Singer, Naftali Tishby. The hierarchical hidden Markov model: Analysis and applications. Machine Learning,1998, 32(1): 41～62
8Richard Sproat, Thomas Emerson. The first international Chinese word segmentation bakeoff. The First SIGHAN Workshop Attached with the ACL2003, Sapporo, Japan, 2003. 133～143
9J Hockenmaier, C Brew. Error-driven learning of Chinese word segmentation. In: J Guo, K T Lua, J Xu, eds. The 12th Pacific Conf on Language and Information, Singapore, 1998
10Andi Wu, Zixin Jiang. Word segmentation in sentence analysis.1998 Int'l Conf on Chinese Information Processing, Beijing, 1998

共引文献738

1刘苗苗,李燕,王欣萌,甘琳琳,李虹.分级阅读初探:基于小学教材的汉语可读性公式研究[J].语言文字应用,2021(2):116-126. 被引量：9
2魏伟,郭崇慧,邢小宇.基于语义关联规则的试题知识点标注及试题推荐[J].数据分析与知识发现,2020,4(2):182-191. 被引量：8
3包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
4王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
5王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：19
6刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
7徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：3
8张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29.
9安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
10蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.

同被引文献94

1董小英.知识优势的理论基础与战略选择[J].北京大学学报（哲学社会科学版）,2004,41(4):37-45. 被引量：31
2马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163-171. 被引量：515
3邹娟,周经野,邓成,刘玲.基于多重启发式规则的中文文本特征值提取方法[J].计算机工程与科学,2006,28(8):78-80. 被引量：3
4杨开城,王斌.从技术的本质看教育技术的本质[J].中国电化教育,2007(9):1-4. 被引量：43
5刘康,赵军.基于层叠CRFs模型的句子褒贬度分析研究[J].中文信息学报,2008,22(1):123-128. 被引量：24
6徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：382
7陈建美,林鸿飞.中文情感常识知识库的构建[J].情报学报,2009,28(4):492-498. 被引量：14
8赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：541
9刘建炜,燕路峰.知识表示方法比较[J].计算机系统应用,2011,20(3):242-246. 被引量：38
10卢会会.论影视字幕翻译中的情感移植[J].电影文学,2011(13):150-151. 被引量：2

引证文献7

1常丹,王玉珍.基于词典的商品评论情感分析[J].邵阳学院学报（自然科学版）,2018,15(5):27-32. 被引量：1
2王敏,徐健.视频弹幕与字幕的情感分析与比较研究[J].图书情报知识,2019,36(5):109-119. 被引量：30
3刘高军,印佳明.基于图书特征及词典的豆瓣图书垃圾评论识别[J].计算机技术与发展,2019,29(11):107-112. 被引量：1
4陈忆金,梁锦玲,古婷骅.新闻视频弹幕用户情感体验特征分析[J].图书与情报,2021(4):75-83. 被引量：17
5颜明阳,闫国梁,李明兰.领域特定情感词典扩展方法在情感分类中的应用[J].计算机应用与软件,2022,39(6):176-182. 被引量：5
6陈沫,李广建.大数据环境下知识融合技术体系研究[J].图书情报工作,2022,66(20):20-31. 被引量：4
7李育强,洪智勇,陈靖辉.基于混合信息增益算法的文本情感分析[J].计算机科学与应用,2019,9(12):2314-2322. 被引量：1

二级引证文献56

1杨珊,田仕顺.政务新媒体中青年用户与主流意识形态内容的互动研究——基于弹幕语言的分析[J].中外文化与文论,2024(2):366-379.
2彭凡会.美食类短视频弹幕中用户情感体验分析——基于B站美食短视频账号“绵羊料理”的文本分析[J].新媒体研究,2023,9(6):28-32. 被引量：2
3肖珺,黄枫怡.情感分析在跨文化传播研究中的方法意义:源流、应用与反思[J].中华文化与传播研究,2022(1):82-93. 被引量：1
4熊太纯,王晓刚.新媒体情境下公共图书馆互动阅读服务研究[J].新世纪图书馆,2021(2):56-61. 被引量：9
5汤凌燕,熊聪聪,王嫄,周宇博,赵子健.基于深度学习的短文本情感倾向分析综述[J].计算机科学与探索,2021,15(5):794-811. 被引量：21
6袁海霞,陆亦蘅,方青青.网络视频实时在线评论用户认可度的影响因素[J].西南石油大学学报（社会科学版）,2021,23(3):37-46.
7李稚,朱春红.双模态情感分析的弹幕网络视频平台营销策略[J].心理科学进展,2021,29(9):1561-1575. 被引量：11
8孙晓宁,姚青.多元主题场景下的用户弹幕与评论特征比较研究:基于Bilibili网站[J].情报理论与实践,2021,44(9):135-141. 被引量：17
9陈忆金,梁锦玲,古婷骅.新闻视频弹幕用户情感体验特征分析[J].图书与情报,2021(4):75-83. 被引量：17
10李正夫,杨玉青,吴丽平,李姣姣.基于GA-CNN-LSTM模型的文本情感分析方法研究[J].江苏海洋大学学报（自然科学版）,2021,30(4):79-86. 被引量：2

1邢长征,李珊.文本情感分析的深度学习方法[J].计算机应用与软件,2018,35(8):102-106. 被引量：16
2李平,戴月明,吴定会.双通道卷积神经网络在文本情感分析中的应用[J].计算机应用,2018,38(6):1542-1546. 被引量：16
3拥措,史晓东,尼玛扎西.短文本情感分析的研究现状——从社交媒体到资源稀缺语言[J].计算机科学,2018,45(B06):46-49. 被引量：5
4刘苗,李蔚,朱述政,喻燕君,刘扬,纪宏.基于互联网文本情感分析的消费情感指数构建[J].统计与信息论坛,2018,33(8):31-38. 被引量：15
5吴鹏,刘恒旺,沈思.基于深度学习和OCC情感规则的网络舆情情感识别研究[J].情报学报,2017,36(9):972-980. 被引量：41
6纪振平,杨杰.基于Pareto前沿连铸多目标协调优化研究[J].控制工程,2018,25(1):76-81. 被引量：1
7王刚,李宁宁,杨善林.基于IDSSL的文本情感分析研究[J].管理工程学报,2018,32(3):126-133. 被引量：7
8邱大平.大英博物馆文物解说词对中国文物英译的启示[J].中国翻译,2018,39(3):108-112. 被引量：33
9任红敏.论“词衰于元”与元词风貌[J].河南社会科学,2018,26(4):65-70. 被引量：1
10樊小琴.书香滋养心灵孩子阅读习惯培养[J].收藏界（名师探索）,2018,0(5):149-149.

计算机技术与发展

2018年第8期

浏览历史

内容加载中请稍等...

基于多特征融合的评论文本情感分析被引量：7

参考文献3

二级参考文献42

共引文献738

同被引文献94

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于多特征融合的评论文本情感分析 被引量：7

参考文献3

二级参考文献42

共引文献738

同被引文献94

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于多特征融合的评论文本情感分析被引量：7