基于并行化递归神经网络的中文短文本情感分类被引量：11

SENTIMENT CLASSIFICATION OF CHINESE SHORT TEXT BASED ON PARALLELIZED RECURSIVE NEURAL NETWORK

下载PDF

导出

摘要情感分析的一个重要应用是判断用户对于产品评论的情感倾向,这些用户评论一般都是字数较少的短文本。传统方法多利用词袋模型获取单词的浅层特征来进行情感分析,利用这些简单特征训练的模型在短文本,尤其是在复杂语法问题上效果并不理想。通过利用深度递归神经网络算法来捕获句子语义信息,并引入中文"情感训练树库"作为训练数据来发现词语情感信息,在短文本情感五分类的问题上取得了较高的准确率。针对复杂模型在海量数据训练上的时间效率问题,通过在Spark并行框架下实现了模型的并行化处理,使得模型的可扩展性和时间效率得到提升。 A significant application of sentiment analysis is to determine the user＇s semannc orjentauon in product reviews which are generally short texts. Traditional methods often acquire the shallow characteristics of words for sentiment analysis through bag-of-words model. However, the model trained through these simple characteristics doesn＇ t have a good performance in short text, especially complex syntax context. Through using deep recursive neural network to capture the semantic information and introducing a Chinese sentiment training treebank as the training set to find the sentiment information, a relatively higher accuracy on five-class short text sentiment analysis is achieved. Aiming at the problem of training time efficiency in large scale data, the parallelization is implemented through Spark, which can enhance the scalability and time efficiency of the model.

作者谢铁郑啸张雷王修君 Xie Tie Zheng Xiao Zhang Lei Wang Xiujun(School of Computer Science and Technology,Anhui University of Technology, Maanshan 243002, Anhui, Chin)

机构地区安徽工业大学计算机科学与技术学院

出处《计算机应用与软件》 2017年第3期205-211,232,共8页 Computer Applications and Software

基金国家自然科学基金项目(61402008 61402009) 安徽省科技重大专项(16030901060) 安徽高校省级自然科学研究重大项目(KJ2014ZD 05) 安徽省高校优秀青年人才支持计划

关键词深度学习情感分析文本分类 SPARK Deep learning Sentiment analysis Text classification Spark

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献6

1李寿山,黄居仁.基于Stacking组合分类方法的中文情感分类研究[J].中文信息学报,2010,24(5):56-61. 被引量：40
2谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1):73-83. 被引量：197
3梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：109
4李宁,罗文娟,庄福振,何清,史忠植.基于MapReduce的并行PLSA算法及在文本挖掘中的应用[J].中文信息学报,2015,29(2):79-86. 被引量：7
5孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：592
6陈钊,徐睿峰,桂林,陆勤.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178. 被引量：48

二级参考文献123

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：325
2刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
3徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：119
4赵世奇,刘挺,李生.一种基于主题的文本聚类方法[J].中文信息学报,2007,21(2):58-62. 被引量：23
5R.Vilalta and Y.Drissi.A perspective view and survey of meta-learning[J].Artificial Intelligence Review,2002,18(2):77-95.
6Saso Dzeroski and Bernard Zenko:Is combining classifiers with stacking better than selecting the best one?[J].Machine Learning.2004,54(3):255-273.
7Rie Ando and Tong Zhang.A framework for learning predictive structures from multiple tasks and unlabeled data[J].Journal of Machine Learning Research,2005,6:1817-1853.
8B.Pang,L.Lee,and S.Vaithyanathan.Thumbs up? Sentiment classification using machine learning techniques[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing(EMNLP-02).2002.
9B.Pang and L.Lee.A sentimental education:Sentiment analysis using subjectivity summarization based on minimum cuts[C]//Proceedings of the 42nd Meeting of the Association for Computational Linguistics(ACL-04).2004.
10E.Riloff,S.Patwardhan,and J.Wiebe.Feature subsumption for opinion analysis[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing(EMNLP-06).2006.

共引文献962

1王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
2高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
3张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
4周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：2
5李灿强,夏志方,丁邡.基于人工智能技术的“数字政府”研究[J].中国经贸导刊,2019(5Z):138-139. 被引量：5
6彭婉,田良臣.信息技术支持下促进深度学习的教学研究——基于语文课程的研究[J].汉字文化,2022(15):159-161. 被引量：1
7热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
8杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
9苑方.基于深度学习的典型神经网络对比分析[J].中国科技纵横,2018,0(19):9-10.
10赵丹琪.人工智能生成物的著作权认定问题研究[J].楚天法治,2018(30):124-127.

同被引文献121

1林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
2洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
3王学民.主成分分析和因子分析应用中值得注意的问题[J].统计与决策,2007,23(11):142-143. 被引量：15
4谢红薇,颜小林,余雪丽.基于本体的Web页面聚类研究[J].计算机科学,2008,35(9):153-155. 被引量：10
5农吉夫,金龙.基于MATLAB的主成分RBF神经网络降水预报模型[J].热带气象学报,2008,24(6):713-717. 被引量：41
6党蕾,张蕾.一种基于知网的中文句子情感倾向判别方法[J].计算机应用研究,2010,27(4):1370-1372. 被引量：21
7王波.基于跨领域知识的基金评论情感分析[J].情报杂志,2011,30(2):44-47. 被引量：5
8赵妍妍,秦兵,车万翔,刘挺.基于句法路径的情感评价单元识别[J].软件学报,2011,22(5):887-898. 被引量：57
9王波,郭晓军.基于情感分析的网络财经媒体通货膨胀预期研究[J].图书情报工作,2011,55(16):140-143. 被引量：1
10杨经,林世平.基于SVM的文本词句情感分析[J].计算机应用与软件,2011,28(9):225-228. 被引量：29

引证文献11

1付淇.社会化短文本及其技术研究[J].景德镇学院学报,2018,33(2):113-117.
2任君,王建华,王传美,王建祥.基于正则化LSTM模型的股票指数预测[J].计算机应用与软件,2018,35(4):44-48. 被引量：34
3张鹏程,贾旸旸.一种基于多层感知器的动态区域联合短时降水预报方法[J].计算机应用与软件,2018,35(11):153-158. 被引量：13
4洪巍,李敏.文本情感分析方法研究综述[J].计算机工程与科学,2019,41(4):750-757. 被引量：80
5陈红琳,魏瑞斌,张玮,张宇航.基于共词分析的国内文本情感分析研究[J].现代情报,2019,39(6):91-101. 被引量：14
6周显春,龚家浩,李芸倩,陈雪姣.基于深度学习的恶意代码检测技术研究进展[J].现代计算机,2019,25(15):42-46. 被引量：1
7康雁,李浩,梁文韬,宁浩宇,霍雯.针对文本情感分类任务的textSE-ResNeXt集成模型[J].计算机工程与应用,2020,56(7):205-209. 被引量：6
8杨奎河,赵萌萌.基于深度学习的情感分析技术[J].信息通信,2020(8):99-101. 被引量：5
9陈朝明.直播网站在线弹幕情感分析[J].软件导刊,2022,21(5):73-78. 被引量：2
10翟宁,韩国胜.基于BERT双通道的疫情舆论情感分类研究[J].湘潭大学学报（自然科学版）,2022,44(3):83-92.

二级引证文献155

1杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
2彭凡会.美食类短视频弹幕中用户情感体验分析——基于B站美食短视频账号“绵羊料理”的文本分析[J].新媒体研究,2023,9(6):28-32. 被引量：2
3杨倩,刁雅静,李家明,葛世伦.基于弹幕的参与式网站用户交互体验研究[J].知识管理论坛,2022(4):417-430. 被引量：1
4江进德,张玉可.皖北乡村旅游的情感特征及其影响因素分析[J].商丘师范学院学报,2023,39(6):64-69.
5包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：3
6相德宝,覃安琪.信任与期待:国际社交媒体推特上的上海城市情绪研究[J].中华文化与传播研究,2022(2):57-72.
7王冬,甘恒,黄文峰,黄政龙,陈中举.基于MLP模型的影评情感分析研究[J].中国科技论文在线精品论文,2021(2):208-211. 被引量：2
8刘海英.探析我国金融机构市场退出的法律制度[J].金融理论与实践,2000(3):25-27. 被引量：3
9谢传明.Visual Basic加密文件一法[J].电脑编程技巧与维护,2000(4):92-94.
10陈建婷.一种基于深度学习的数据预测方法[J].电子技术与软件工程,2019(6):151-152. 被引量：7

1王永康.dBASEⅢ中容易被忽略的一个语法问题[J].北方交通大学学报,1991,15(4):100-101.
2王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类[J].计算机应用,2010,30(3):603-606. 被引量：38
3范云杰,刘怀亮.基于维基百科的中文短文本分类研究[J].现代图书情报技术,2012(3):47-52. 被引量：34
4胡勇军,江嘉欣,常会友.基于LDA高频词扩展的中文短文本分类[J].现代图书情报技术,2013(6):42-48. 被引量：36
5朱明,梁栋,范益政,张艳,颜普.基于谱特征的图像匹配算法[J].华南理工大学学报（自然科学版）,2015,43(9):60-66. 被引量：9
6王千惠.开放式杀毒软件弊多利少[J].微电脑世界,1996(1):145-145.
7李国帅.浅谈高中英语教学中的语法问题[J].新课程学习（下）,2011(4):127-127.
8刘泽文,丁冬,李春文.基于条件随机场的中文短文本分词方法[J].清华大学学报（自然科学版）,2015,55(8):906-910. 被引量：17
9廖志芳,周国恩,李俊锋,刘飞,蔡飞.中文短文本语法语义相似度算法[J].湖南大学学报（自然科学版）,2016,43(2):135-140. 被引量：12
10高翔,李兵.中文短文本去重方法研究[J].计算机工程与应用,2014,50(16):192-197. 被引量：4

计算机应用与软件

2017年第3期

浏览历史

内容加载中请稍等...

基于并行化递归神经网络的中文短文本情感分类被引量：11

参考文献6

二级参考文献123

共引文献962

同被引文献121

引证文献11

二级引证文献155

相关作者

相关机构

相关主题

浏览历史

基于并行化递归神经网络的中文短文本情感分类 被引量：11

参考文献6

二级参考文献123

共引文献962

同被引文献121

引证文献11

二级引证文献155

相关作者

相关机构

相关主题

浏览历史

基于并行化递归神经网络的中文短文本情感分类被引量：11