基于PMI的递归自编码器的情感分析方法被引量：1

Sentiment Analysis Method of Recursive Autoencoder Based on PMI

下载PDF

导出

摘要为改善传统机器学习方法无法考虑文本语义信息的缺陷,利用递归自编码器(RAE)树形结构学习短语向量空间表示。该方法可在常用的数据集上取得良好效果,但是在学习向量表示过程中,往往需要大量标记数据标记每个结点,人工标注工作量较大。因此提出一种半监督方法,利用PMI方法计算终端结点情感极性值,并考虑上下文程度副词和否定词对修饰情感词语的情感倾向与情感强度的影响。实验结果表明,与手动标记的传统RAE模型相比,引入PMI方法标记结点后,准确率提升至88.1%,可一定程度减少人工标注的工作量。 In order to improve the shortcomings of traditional machine learning methods that are difficult to consider text semantic information,the recursive autoencoder(RAE)is used to learn the vector space representation of phrases with its tree structure,and it has achieved good results on commonly used data sets.However,in the process of learning vector representation,a large amount of labeling data is often needed to label each node.This paper proposes a semi-supervised method that uses the PMI method to calculate the emotional polarity value of the terminal node,and considers the influence of degree adverbs and negative words in the context on the emotional tendency and emotional strength of the modified emotional words.The experimental results show that compared with the traditional RAE model,after the PMI method is introduced to label the nodes,the accuracy is increased to 88.1%,and a lot of manual labeling workload is saved.

作者孙琦梁永全 SUN Qi;LIANG Yong-quan(College of Computer Science and Engineering,Shandong University of Science and Technology,Qingdao 266590,China)

机构地区山东科技大学计算机科学与工程学院

出处《软件导刊》 2021年第6期59-62,共4页 Software Guide

关键词情感分析递归自编码器 PMI sentiment analysis recursive autoencoder PMI

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1周胜臣,瞿文婷,石英子,施询之,孙韵辰.中文微博情感分析研究综述[J].计算机应用与软件,2013,30(3):161-164. 被引量：81
2梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
3梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91

二级参考文献41

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：136
3B.Pang,L.Lee.Seeing stars:Exploiting class relationships for sentiment categorization with respect to rating scales[C]Proceedings of the ACL,2005:115-124.
4Y.Bengio,R.Ducharme,P.Vincent,et al.A neural probabilistic language model[J].Journal of Machine Learning Research,2003,3:1137-1155.
5Collobert R,Weston J.A unified architecture for natural language processing:Deep neural networks with multitask learning[C]//Proceedings of the 25th international conference on Machine learning.ACM,2008:160-167.
6Mnih A,Hinton G E.A Scalable Hierarchical Distributed Language Model[C]//Proceedings of NIPS.2008::1081-1088.
7Mikolov T,Karafiát M,Burget L,et al.Recurrent neural network based language model[C]//Proceedingsof INTERSPEECH.2010:1045-1048.
8Mikolov T,Kombrink S,Burget L,et al.Extensions of recurrent neural network language model[C]//Proceedings of Acoustics,Speech and Signal Processing(ICASSP),2011 IEEE International Conference on.IEEE,2011:5528-5531.
9Kombrink S,Mikolov T,Karafiát M,et al.Recurrent Neural Network Based Language Modeling in Meeting Recognition[C]//Proceedings of INTERSPEECH.2011:2877-2880.
10Mikolov T,Chen K,Corrado G,et al.Efficient estimation of word representations in vector space[J].arXiv preprint arXiv:1301.3781,2013.

共引文献267

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2章宣,赵宝奇,孙军梅,葛青青,肖蕾,尉飞.面向微博文本的自杀风险识别模型[J].计算机系统应用,2020,29(11):121-127. 被引量：3
3王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
4孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1
5热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
6刘晓娟,尤斌,张爱芸.基于微博数据的应用研究综述[J].情报杂志,2013,32(9):39-45. 被引量：18
7陈晓美,王付国,吴宏伟,孙中秋.社会化网络评论观点挖掘的研究热点与应用进展[J].情报科学,2013,31(11):119-124. 被引量：9
8欧阳纯萍,阳小华,雷龙艳,徐强,余颖,刘志明.多策略中文微博细粒度情绪分析研究[J].北京大学学报（自然科学版）,2014,50(1):67-72. 被引量：23
9王银,吴新玲.中文微博情感分析方法研究[J].广东技术师范学院学报,2014,35(3):63-68. 被引量：1
10刘杰.一种基于自动特征权值的实体相似度计算方法[J].重庆科技学院学报（自然科学版）,2014,16(3):157-160. 被引量：2

同被引文献6

1周敬一,郭燕,丁友东.基于深度学习的中文影评情感分析[J].上海大学学报（自然科学版）,2018,24(5):703-712. 被引量：15
2王敏,徐健.视频弹幕与字幕的情感分析与比较研究[J].图书情报知识,2019,36(5):109-119. 被引量：30
3万齐斌,董方敏,孙水发.基于BiLSTM-Attention-CNN混合神经网络的文本分类方法[J].计算机应用与软件,2020,37(9):94-98. 被引量：20
4尚迪雅,孙华,洪振厚,曾庆亮.基于无梯度进化的神经架构搜索算法研究综述[J].计算机工程,2020,46(9):16-26. 被引量：6
5魏上斐,乔保军,于俊洋,姚相宇.基于预训练语言模型词向量融合的情感分析研究[J].计算机应用与软件,2021,38(5):152-157. 被引量：5
6张宜飞,张迎,王中卿,王红玲.基于上下文信息的产品评论摘要Bi-LSTM模型[J].计算机应用与软件,2021,38(6):113-119. 被引量：2

引证文献1

1李正夫,杨玉青,吴丽平,李姣姣.基于GA-CNN-LSTM模型的文本情感分析方法研究[J].江苏海洋大学学报（自然科学版）,2021,30(4):79-86. 被引量：2

二级引证文献2

1刘锦峰.基于面部表情和头部姿态的学习者情绪分析与评价研究[J].信息与电脑,2022,34(6):180-183. 被引量：1
2郑志建,林土水,杨蕊平,阙文华,姚毅.基于LSTM模型的用户情感分析方法研究[J].计算机与网络,2024,50(4):366-370.

1张志俊,丁成.学习情境教学设计中思政元素的挖掘与融入--以认知建筑抗震结构学习情境教学设计为例[J].黄冈职业技术学院学报,2021,23(3):48-51. 被引量：4
2鲁雨晴,宋行健,张芷铭,王中言,李琛,邱江.新型冠状病毒肺炎疫情期对复工复学微博评论数据的情感分析[J].中国健康心理学杂志,2021,29(5):674-679. 被引量：4
3曹科,戴罡,李新.构建长效机制推进企业内审与纪检监察发挥监督合力[J].中国审计,2021(9):63-64.
4李菲菲,吴璠,王中卿.基于生成式对抗网络和评论专业类型的情感分类研究[J].数据分析与知识发现,2021,5(4):72-79. 被引量：7
5李金宇,王晓晔,彭宪,田昊,吉智豪,罗一宁,李金泳.基于双向LSTM的文本情感倾向分类[J].计算机科学与应用,2021,11(5):1401-1410. 被引量：1
6刘丽群,刘玺辰.即时通讯一对一会话中表情符号的使用风格[J].中南民族大学学报（人文社会科学版）,2021,41(6):123-130. 被引量：2
7宋刚.《一秒钟》的“情感结构”与人物塑造[J].电影文学,2021(10):103-105. 被引量：1
8严鹏.基于自注意深度学习的商品评论情感分类[J].软件导刊,2021,20(6):75-79. 被引量：1
9李惟怡,张兵,王惠君,王志宏,王柳森,王邵顺子,郝丽鑫,姜红如.1989-2015年中国15个省(自治区、直辖市)18~35岁成年人膳食维生素摄入现状及其变化趋势[J].卫生研究,2021,50(3):448-453. 被引量：6
10陈俊龙,吴丽丽.基于RFME模型和AdaBoost分类器的电子商务客户关系研究[J].软件,2021,42(3):1-7. 被引量：1

软件导刊

2021年第6期

浏览历史

内容加载中请稍等...

基于PMI的递归自编码器的情感分析方法被引量：1

参考文献3

二级参考文献41

共引文献267

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于PMI的递归自编码器的情感分析方法 被引量：1

参考文献3

二级参考文献41

共引文献267

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于PMI的递归自编码器的情感分析方法被引量：1