融合主题的CLSTM短文本情感分类被引量：1

Topic-based Contextual LSTM for Short-text Sentiment Classification

下载PDF

导出

摘要针对短文本简短的特性,为提高对其进行情感分类准确率,提出了T-CLSTM(Topic-based Context CLSTM)模型。该模型通过LDA模型生成词主题向量,并构建滑动窗口词主题上下文和层次词主题上下文,实现短文本信息扩展。探讨词主题、词主题上下文的构成,以及滑动窗口尺寸对词主题上下文的影响;将词向量和词主题上下文向量作为输入特征量训练分类模型,进行情感分类。在COAE2014语料上进行实验,结果表明,本文提出的模型分类准确率可达92.3%,相比baseline算法SVM和LSTM分别提高2%和4%。 In order to improve the accuracy of sentiment classification of short text,a T-CLSTM model was proposed to according to its characteristic.The model generates word topic vectors with LDA model,and constructs sliding window word topic context and hierarchical word topic context to extend the short text information.The composition of word topic,word topic context and the effect of the sliding window size on the topic context were discussed.The word vector and word topic context vectors are used as input features to train models for sentiment classification.Experimental results on the COAE2014 corpus show that the proposed model can obtain 92.3%accuracy,which is 2%and 4%higher than that of baseline algorithms SVM and LSTM.

作者秦锋黄超郑啸邵光梅 QIN Feng;HUANG Chao;ZHENG Xiao;SHAO Guangmei(College of Computer Science and Technology,Anhui University of Technology,Ma’anshan 243032 China)

机构地区安徽工业大学计算机科学与技术学院

出处《安徽工业大学学报（自然科学版）》 CAS 2017年第3期289-295,共7页 Journal of Anhui University of Technology（Natural Science）

基金国家自然科学基金项目(61402008 61402009) 安徽省科技重大专项(16030901060) 安徽省高校自然科学研究重大项目(KJ2014ZD05) 安徽省高校优秀青年人才支持计划

关键词主题滑动窗口上下文长短期记忆模型情感分类 topic sliding window context LSTM sentiment classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1苏艳,居胜峰,王中卿,李寿山,周国栋.基于随机特征子空间的半监督情感分类方法研究[J].中文信息学报,2012,26(4):85-90. 被引量：16
2高伟,王中卿,李寿山.基于集成学习的半监督情感分类方法研究[J].中文信息学报,2013,27(3):120-126. 被引量：12
3梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
4李天辰,殷建平.基于主题聚类的情感极性判别方法[J].计算机科学与探索,2016,10(7):989-994. 被引量：7

二级参考文献67

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2赵军,许洪波,黄萱菁,谭松波,刘康,张奇.中文倾向性分析评测技术报告[C]//第一届中文倾向性分析评测会议(The First Chinese Opinion Analysis Evaluation).COAE,2008.
3黄萱菁,赵军.中文文本情感分析[J].中国计算机学会通讯,2008,4(2).
4赵军,许洪波,黄萱菁,等.中文倾向性分析评测技术报告[A].第一届中文倾向性分析评测会议,2008.
5Pang B., L. Lee, S. Vaithyanathan. Thumbs up? Sentiment Classification using Machine Learning Tech- niques. [C]//Proceedings of the Conference on Empir- ical Methods in Natural Language Processing (EMN- LP-02). 2002.
6Zagibalov T. ,J. Carroll. Automatic Seed Word Selec- tion for Unsupervised Sentiment Classification of Chi- nese Test. [C]//Proceedings of the 22nd International Conference on Computational Linguistics (COLING- O8). 2008.
7Yarowsky D. Unsupervised Word Sense Disambigu- ation Rivaling Supervised Methods[C]//Proeeedings of Annual Meeting on Association for Computational Lin- guisties(ACL-05). 1995.
8Dasgupta S. , V. Ng. Mine the Easy, Classily the Hard: A Semi Supervised Approach to Automatic Sen- timent Classification [C]//Proceedings of Annual Meeting on Association for Computational Linguistics (ACL-09). 2009.
9Wan X. Co-Training for Cross-Lingual Sentiment Classifieation[C]//Proeeedings of Annual Meeting on Association for Computational Linguistics (ACL-09). 2009.
10Li S. , C. Huang, G. Zhou, et al. Employing Per- sonal/Impersonal Views in Supervised and Semi-su- pervised Sentiment Classification[C]//Proceedings of Annual Meeting on Association for Computational Linguistics (ACL-10). 2010.

共引文献139

1王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
2杨梦月,卫伟,陆慧娟,卢海峰.基于差分进化的中文情感分类集成算法研究[J].计量学报,2020,41(2):225-230. 被引量：2
3热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
4高伟,王中卿,李寿山.基于集成学习的半监督情感分类方法研究[J].中文信息学报,2013,27(3):120-126. 被引量：12
5王志昊,王中卿,李寿山,李培峰,施寒潇.面向半监督情感分类的特征选择方法研究[J].中文信息学报,2013,27(6):96-102. 被引量：2
6刘智,杨宗凯,刘三(女牙),王泰,孟文婷,王胜明.采用动态特征选择的中文情感识别研究[J].小型微型计算机系统,2014,35(2):358-364. 被引量：4
7薛云霞,李寿山,王中卿.基于社会关系网络的半监督情感分类[J].北京大学学报（自然科学版）,2014,50(1):61-66. 被引量：4
8肖进,刘潇潇,谢玲,刘敦虎,黄静.代价敏感的目标客户选择半监督集成模型研究[J].中国管理科学,2018,26(11):186-196. 被引量：4
9肖正,刘辉,李兵.一种基于语义距离的Web评论SVM情感分类方法[J].计算机科学,2014,41(9):248-252. 被引量：13
10王文,王树锋,李洪华.基于文本语义和表情倾向的微博情感分析方法[J].南京理工大学学报,2014,38(6):733-738. 被引量：23

同被引文献11

1徐戈,王厚峰.自然语言处理中主题模型的发展[J].计算机学报,2011,34(8):1423-1436. 被引量：237
2张志飞,苗夺谦,高灿.基于LDA主题模型的短文本分类方法[J].计算机应用,2013,33(6):1587-1590. 被引量：77
3赵辉,刘怀亮.一种基于维基百科的中文短文本分类算法[J].图书情报工作,2013,57(11):120-124. 被引量：16
4邸鹏,段利国.一种新型朴素贝叶斯文本分类算法[J].数据采集与处理,2014,29(1):71-75. 被引量：51
5唐晓波,向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作,2014,58(5):58-63. 被引量：65
6吕超镇,姬东鸿,吴飞飞.基于LDA特征扩展的短文本分类[J].计算机工程与应用,2015,51(4):123-127. 被引量：49
7张群,王红军,王伦文.词向量与LDA相融合的短文本分类方法[J].现代图书情报技术,2016(12):27-35. 被引量：40
8邓三鸿,傅余洋子,王昊.基于LSTM模型的中文图书多标签分类研究[J].数据分析与知识发现,2017,1(7):52-60. 被引量：27
9杜永萍,陈守钦,赵晓铮.基于特征扩展与深度学习的短文本情感判定方法[J].计算机科学,2017,44(10):283-288. 被引量：4
10赵明,杜会芳,董翠翠,陈长松.基于word2vec和LSTM的饮食健康文本分类研究[J].农业机械学报,2017,48(10):202-208. 被引量：43

引证文献1

1吴彦文,黄凯,王馨悦,林娴.一种融合主题模型的短文本情感分类方法[J].小型微型计算机系统,2019,40(10):2082-2086. 被引量：19

二级引证文献19

1张雪英,闾国年,叶鹏.大数据地理信息系统:框架、技术与挑战[J].现代测绘,2020(6):1-8. 被引量：8
2袁创国.浓香型白酒生产如何改造低产质窖池[J].酿酒科技,2000(3):40-41.
3孙李丽,郭琳,文旭,王正良.一种BP神经机器英语翻译自动化评判系统的设计[J].信息技术,2020,44(8):12-16. 被引量：8
4陈欢,黄勃,朱翌民,俞雷,余宇新.结合LDA与Self-Attention的短文本情感分类方法[J].计算机工程与应用,2020,56(18):165-170. 被引量：8
5周琴英,杨文正.推荐系统用户模型的研究热点及启示——基于近十年核心文献的知识图谱分析[J].情报科学,2020,38(9):166-173. 被引量：10
6陆敬筠,胡舜奕,俞建光.基于LDA-BiLSTM模型的高校网络舆情监测方法及实证[J].情报理论与实践,2020,43(11):156-161. 被引量：11
7段丹丹,唐加山,温勇,袁克海.基于BERT模型的中文短文本分类算法[J].计算机工程,2021,47(1):79-86. 被引量：78
8陈丽萍,吴其林,李小荣.“大数据分析”课程案例设计与分析--以网络新闻分析案例设计为例[J].内蒙古财经大学学报,2021,19(1):26-28. 被引量：2
9李明轩,周筠昌,陈珂.融合主题模型与注意力机制的情感分析方法[J].广东石油化工学院学报,2021,31(1):48-53.
10孙李丽,郭琳,张文诺,文旭.基于机器学习的文学作品英译自动评价[J].计算机系统应用,2021,30(3):196-201.

1王丽君.把社区纳入高校资助育人工作的考量[J].江苏高教,2017(12):93-95. 被引量：1
2蔡晓龙.深度学习在图像描述中的应用[J].电脑知识与技术,2017,13(8X):178-179. 被引量：1
3桂建华.电磁感应“单杆+导轨”模型分类全解析[J].中学物理,2018,36(2):54-58. 被引量：3
4蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：103
5常月红.非物质文化遗产世界行--中国紫砂壶洛杉矶展览侧记[J].江苏陶瓷,2018,51(1):77-78.
6李博涵,刘汇丹,龙从军,吴健.基于深度学习的藏文分词方法[J].计算机工程与设计,2018,39(1):194-198. 被引量：17
7朱作权,陈皓.急性脑梗死伴2型糖尿病患者焦虑情绪与神经损伤程度、氧化应激反应的相关性研究[J].海南医学院学报,2018,24(3):417-420. 被引量：10
8王建,舒睿俊,王旭,周婷.面向通信系统的GPP平台内核调度算法研究[J].信息技术,2017,41(12):22-25.
9秦先普.TOPic:要用创意决定话语权——对话TOPic创始人陈声雄[J].中国广告,2018,0(4):31-33.
10胡巴归来,不再孤单—Base FX《捉妖记2》特效制作解析[J].艺术教育,2018(8):35-40.

安徽工业大学学报（自然科学版）

2017年第3期

浏览历史

内容加载中请稍等...

融合主题的CLSTM短文本情感分类被引量：1

参考文献4

二级参考文献67

共引文献139

同被引文献11

引证文献1

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

融合主题的CLSTM短文本情感分类 被引量：1

参考文献4

二级参考文献67

共引文献139

同被引文献11

引证文献1

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

融合主题的CLSTM短文本情感分类被引量：1