基于降噪自动编码器的不平衡情感分类研究被引量：12

Research of Unbalance Sentiment Classification Based on Denoising Autoencoders

下载PDF

导出

摘要目前,网络评论的情感分类研究大部分是不平衡样本数据,正向样本的数量一般远大于负向样本,对这种不平衡样本集进行分类时容易产生少数类误差较大的问题。而且由于网络评论的表达形式多变,不易获取到大量的有监督的数据。针对上述问题,对无监督的不平衡网络评论情感分类进行研究。首先通过改进降噪自动编码器,提高少数类的特征值,避免分类样本向多数类偏移。然后将获取的特征值作为k-means算法的输入值,实现了无监督的样本分类。实验证明,该算法对不平衡率较高的样本具有良好的适应性,从而验证了算法的有效性。 Currently, the network comments sentiment classification studies usually use unbalanced sample data in which the number of positive samples generally much larger than the negative sample. That imbalance sample classification is prone to minority class large error. In addition the network comments expression varied, it is difficult to get a large number of supervised data. In order to solver these problems, the Web reviews imbalance unsu- pervised sentiment classification is studied. First, through improving the Denoising Autoencoders, minority class characteristic value is increased to avoid the majority class classification sample deviation. Then the eigenvalues is put in k-means algorithm as input values to achieve unsupervised classification. Experimental results show that the algorithm has a good adaptability for higher imbalance sample data, and verify the effectiveness of the algorithm.

作者秦胜君卢志平

机构地区广西科技大学管理学院

出处《科学技术与工程》北大核心 2014年第12期232-235,共4页 Science Technology and Engineering

基金欠发达地区工业化与信息化融合及其系统动力机制研究(11FJL007) 广西教育厅人文社科研究项目(SK13YB069)资助

关键词情感分类深度学习降噪自动编码器不平衡数据 sentiment classification deep learning denoising autoencoder unbalance data

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1江海洋.基于评论挖掘和用户偏好学习的评分预测协同过滤[J].计算机应用研究,2010,27(12):4430-4432. 被引量：3
2于重重,商利利,谭励,涂序彦,杨扬.半监督学习在不平衡样本集分类中的应用研究[J].计算机应用研究,2013,30(4):1085-1089. 被引量：8
3Li S, Zhou G, Wang Z, et al. Imbalanced sentiment classifica- tion. Proceeding of CIKM-11,2011.
4王志昊,王中卿,李寿山,李培峰.不平衡情感分类中的特征选择方法研究[J].中文信息学报,2013,27(4):113-118. 被引量：6
5王中卿,李寿山,朱巧明,李培峰,周国栋.基于不平衡数据的中文情感分类[J].中文信息学报,2012,26(3):33-37. 被引量：11
6袁兴梅,杨明,杨杨.一种面向不平衡数据的结构化SVM集成分类器[J].模式识别与人工智能,2013,26(3):315-320. 被引量：22
7Vincent P, Larochelle H. Extracting and composing robust features with denosing autocoders. The 25 th International Conference on Ma- chine Learning, 2008 : 1096-1104.

二级参考文献67

1项贻强,李毅,周畅,周逊盛.桥梁结构在线健康监测预警系统Ⅰ——监测评估预警体系和模块设计[J].长沙交通学院学报,2009,25(1):26-31. 被引量：10
2刘胥影,吴建鑫,周志华.一种基于级联模型的类别不平衡数据分类方法[J].南京大学学报（自然科学版）,2006,42(2):148-155. 被引量：23
3GOLDBERG D,NICHOLS D,OKI B M,et al.Using collaborative filtering to weave an information tapestry[J].Communications of the ACM,1992,35(12):61-70.
4RESNICK P,IACOVOU N,SUCHAK M,et al.GroupLens:an open architecture for collaborative filtering of netnews[C] //Proc of ACM Conference on Computer-Supported Cooperative Work.New York:ACM Press,1994:175-186.
5SHARDANAND U,MAES P.Social information filtering:algorithms for automating "word of mouth"[C] //Proc of ACM Conference on Human Factors in Computing Systems.New York:ACM Press,1995:210-217.
6HILL W,STEAD L,ROSENSTEIN M,et al.Recommending and evaluating choices in a virtual community of use[C] //Proc of ACM Conference on Human Factors in Computing Systems.New York:ACM Press,1995:194-201.
7BREESE J,HECHERMAN D,KADIE C.Empirical analysis of predictive algorithms for collaborative filtering[C] //Proc of the 14th Conference on Uncertainty in Artificial Intelligence.1998:43-52.
8LU Yue,ZHAI Cheng-xiang,SUNDARESAN N.Rated aspect summarization of short comments[C] //Proc of the 18th International Conference on World Wide Web.New York:ACM Press,2009:131-140.
9SARWAR B M,KARYPIS G,KONSTAN J A,et al.Application of dimensionality reduction in recommender system:a case study[C] //Proc of Web KDD Workshop.2000.
10AGGARWAL C C.On the effects of dimensionality reduction on high dimensional similarity search[C] //Proc of ACM SIGMOD-SIGACT-SIGART Symposium on Principles of Database Systems.New York:ACM Press,2001.

共引文献43

1程艳,朱海,项国雄,唐天伟,钟林辉,王国玮.融合CNN和EWC算法的不平衡文本情绪分类方法[J].中文信息学报,2020(4):92-100. 被引量：5
2刘欢欢,李寿山,周国栋,李逸薇.中文情绪识别方法研究[J].江西师范大学学报（自然科学版）,2013,37(2):120-124. 被引量：5
3王志昊,王中卿,李寿山,李培峰.不平衡情感分类中的特征选择方法研究[J].中文信息学报,2013,27(4):113-118. 被引量：6
4盛小春,岳晓冬.基于粗糙集理论的协同训练算法[J].计算机应用研究,2013,30(12):3546-3550. 被引量：1
5李寿山,李逸薇,刘欢欢,黄居仁.基于情绪相关事件上下文的隐含情绪分类方法研究[J].中文信息学报,2013,27(6):90-95. 被引量：4
6丛雪燕.基于误差模型的混合分类算法[J].计算机与现代化,2014(1):100-103.
7王烁,徐健,刘颖.网络“水军”探测方法研究[J].现代图书情报技术,2014(7):92-100. 被引量：3
8吉利鹏,张洪伟.Memetic算法及其在分类中的应用研究[J].四川理工学院学报（自然科学版）,2014,27(5):43-46.
9孟银凤,梁吉业.基于最小二乘支持向量机的函数型数据回归分析[J].模式识别与人工智能,2014,27(12):1124-1130. 被引量：8
10李湘东,曹环,黄莉.基于分布偏斜训练集的特征选择方法研究[J].情报理论与实践,2015,38(4):139-144. 被引量：2

同被引文献82

1余晃晶.小波降噪阈值选取的研究[J].绍兴文理学院学报（自然科学版）,2004,24(9):34-38. 被引量：10
2韦振中,黄廷磊.基于支持向量机和遗传算法的特征选择[J].广西工学院学报,2006,17(2):18-21. 被引量：12
3徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：107
4HOBFOLL S E. Social and Psychological Resources and Adaptation [J]. Review of General Psychology, 2002(4): 307-324.
5MOHAMED M Mostafa. More than Words: Social Networks~ Text Mining for Consumer Brand Sentiments[J]. Expert Systems with Applications, 2013,40(10) : 4241-4251.
6BENGIO Y,DELALLEAU O. On the Expressive Power of Deep Architectures [C]. Proc.of the 22nd Intemational Conference on Algorithmic Learning Theory, 2011:18-36.
7LAROCHELLE H, MANDEI. M,PASCANU R,et al. Learning Algorithms for the Classification Restricted Boltzmann Maehine[J].Journal of Machine Learning Research, 2012,13 : 643 - 669.
8BENGIO Y, COURVII.LE A, BINCENT P. Unsupervised Feature Learning and Deep Learning; a Review and New Perspectives[R].Montreal: Department of Computer Science and Operations Research, University of Montreal, 2012.
9Schafer J B, Dan F, Herlocker J, et al. Collaborative Fil- tering Recommender Systems [ M ]// The Adaptive Web. Springer Berlin Heidelberg, 2007:291-324.
10Rieei F, Rokach L, Shapira B. Introduction to recommen- der systems handbook [ M ]// Recommender Systems Hand- book. 2010 : 1-35.

引证文献12

1秦胜君.基于稀疏自动编码器的微博情感分类应用研究[J].广西科技大学学报,2015,26(3):36-40. 被引量：3
2郭海凤,李广水,仇彬任.降噪自动编码机在图像识别中的应用[J].金陵科技学院学报,2015,31(3):32-35. 被引量：1
3谢霖铨,梁博群.基于降噪自编码的推荐算法[J].计算机与现代化,2016(2):38-41. 被引量：3
4刘红光,马双刚,刘桂锋.基于降噪自动编码器的中文新闻文本分类方法研究[J].现代图书情报技术,2016(6):12-19. 被引量：8
5李阳辉,谢明,易阳.基于降噪自动编码器及其改进模型的微博情感分析[J].计算机应用研究,2017,34(2):373-377. 被引量：12
6李阳辉,谢明,易阳.基于深度学习的社交网络平台细粒度情感分析[J].计算机应用研究,2017,34(3):743-747. 被引量：31
7杨明极,张贵山.基于栈式自动编码机的语音质量评价方法[J].小型微型计算机系统,2018,39(10):2134-2137. 被引量：3
8谷丛丛,王艳,严大虎,纪志成.基于自编码组合特征提取的分类方法研究[J].系统仿真学报,2018,30(11):4132-4140. 被引量：6
9李晴晴,侯瑞春,丁香乾.基于改进堆叠自编码器的滚动轴承故障诊断[J].计算机工程与设计,2019,40(7):2064-2070. 被引量：22
10梁凤勤,高媛,刘功银,黄建国,周权,盛瀚民.基于AutoEncoder的油气管道控制系统异常状态监测方法[J].电子测量与仪器学报,2019,31(12):10-18. 被引量：6

二级引证文献100

1牛一凡,邵景峰.基于非线性数据融合的设备多阶段寿命预测[J].信息与控制,2019,48(6):729-737. 被引量：9
2薛福亮,刘丽芳.一种基于CRF与ATAE-LSTM的细粒度情感分析方法[J].数据分析与知识发现,2020,4(2):207-213. 被引量：10
3黎波.“地球的公转”多媒体教学设计[J].地理教学,2000(8):38-39.
4程惠华,黄发良,潘传迪.基于产品评论情感分析的用户满意度挖掘[J].福建师范大学学报（自然科学版）,2017,33(1):14-21. 被引量：2
5刘晶,和述群,朱清香,安雅程,许楠,刘凯.基于深度学习的线上农产品销量预测模型研究[J].计算机应用研究,2017,34(8):2291-2293. 被引量：13
6刘丽娜,齐佳音,齐宏伟,蒋思.在线评论中离散情感的分布研究[J].情报科学,2017,35(8):121-128. 被引量：4
7粟郁,王立华.基于社交网络的学习平台在高校教学中的应用研究[J].中国管理信息化,2018,21(6):224-225. 被引量：2
8邱爽,姜明洋,张智丰,卢奕南,裴志利.基于栈式降噪自动编码器的中文短文本分类[J].内蒙古民族大学学报（自然科学版）,2017,32(5):400-405. 被引量：1
9陈铭,徐丽芳.Narrative Science:讲述隐藏在数据中的故事[J].出版参考,2018(2):15-18. 被引量：1
10贾文娟,张煜东.自编码器理论与方法综述[J].计算机系统应用,2018,27(5):1-9. 被引量：24

1秦胜君.基于稀疏自动编码器的微博情感分类应用研究[J].广西科技大学学报,2015,26(3):36-40. 被引量：3
2姚程宽.SVM在不平衡样本集中的应用研究[J].计算机与数字工程,2007,35(10):21-23. 被引量：2
3魏亚利,刘丽,项雪琰,齐绪停.基于支持向量机的不平衡样本集分类算法[J].山东师范大学学报（自然科学版）,2016,31(2):18-21.
4于重重,商利利,谭励,涂序彦,杨扬.半监督学习在不平衡样本集分类中的应用研究[J].计算机应用研究,2013,30(4):1085-1089. 被引量：8
5陆新建.随需应变的报表制作[J].扬子石油化工,2005,20(2):55-58.
6丁福利,孙立民.处理不平衡样本集的欠采样算法[J].计算机工程与设计,2013,34(12):4345-4350. 被引量：7
7郎艳分,寇雪梅.浅谈现代数控机床的电气故障诊断及维修实例[J].硅谷,2008,1(23):15-16.
8徐妙婧,胡福云,祖一康.浅谈C语言if语句的教学[J].计算机光盘软件与应用,2012,15(18):271-271.
9丁福利,孙立民.基于支持向量机的不平衡样本分类研究[J].科学技术与工程,2014,22(3):81-85. 被引量：7
10唐明珠,阳春华,桂卫华.基于CS-SVM的氧化铝蒸发过程故障检测[J].控制工程,2011,18(4):645-649. 被引量：2

科学技术与工程

2014年第12期

浏览历史

内容加载中请稍等...

基于降噪自动编码器的不平衡情感分类研究被引量：12

参考文献7

二级参考文献67

共引文献43

同被引文献82

引证文献12

二级引证文献100

相关作者

相关机构

相关主题

浏览历史

基于降噪自动编码器的不平衡情感分类研究 被引量：12

参考文献7

二级参考文献67

共引文献43

同被引文献82

引证文献12

二级引证文献100

相关作者

相关机构

相关主题

浏览历史

基于降噪自动编码器的不平衡情感分类研究被引量：12