基于情感标签的极性分类被引量：4

Polarity Classification Based on Sentiment Tags

下载PDF

导出

摘要情感极性分析是文本挖掘中一种非常重要的技术.然而在不同领域中,很多情感极性分类系统存在分类精度低和缺少大量标注数据的缺陷.针对这些问题,提出了一种基于情感标签的极性分类方法.首先通过所有文本建立Sentiment-Topic模型,抽取出文本的情感标签;然后利用情感标签将文本划分为两个子文本,并通过Co-training算法对子文本进行分类;最后合并两个子文本的分类结果,并确定文本的情感极性.实验结果表明该方法具有较高的分类精度,而且不需要大量的分类样本. Sentiment analysis is a very important technology in text mining. However,a number of systems require amounts of annotated training data in different fields. In order to solve these problems, an approach to polarity classification based on sentiment tags is proposed. Firstly,o n the basis of all the documents, the sentiment-topic model is developed and the sentiment tags for each review are extracted. Then each review is divided into two sub-texts by these sentiment tags, and each sub-text is classified by exploiting the co-training algorithm. Finally, the category results of two sub-texts are combined to determine document-level polarity of each review. Experimental results show that compared with other algorithms, the method improves the classification precision without a large number of annotated samples.

作者周孟朱福喜

机构地区武汉大学计算机学院

出处《电子学报》 EI CAS CSCD 北大核心 2017年第4期1018-1024,共7页 Acta Electronica Sinica

基金国家自然科学基金(No.61272277)

关键词极性分类情感标签半监督学习 co-training学习 polarity classification sentiment tag semi-supervised learning co-training learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1冯时,付永陈,阳锋,王大玲,张一飞.基于依存句法的博文情感倾向分析研究[J].计算机研究与发展,2012,49(11):2395-2406. 被引量：34
2江雨燕,李平,王清.基于共享背景主题的Labeled LDA模型[J].电子学报,2013,41(9):1794-1799. 被引量：17
3欧阳继红,刘燕辉,李熙铭,周晓堂.基于LDA的多粒度主题情感混合模型[J].电子学报,2015,43(9):1875-1880. 被引量：23
4王李冬,魏宝刚,袁杰.基于概率主题模型的文档聚类[J].电子学报,2012,40(11):2346-2350. 被引量：24
5赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：543
6卜湛,伍之昂,曹杰,朱桂祥.在线评论情感计算与博弈预测[J].电子学报,2015,43(12):2530-2535. 被引量：13

二级参考文献69

1杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量：19
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
3姚天昉,娄德成.汉语语句主题语义倾向分析方法的研究[J].中文信息学报,2007,21(5):73-79. 被引量：78
4Turney P. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews [C]//Proc of 40th Annual Meeting of the Association for Computational Linguistics, Stroudsburg, USA: ACL, 2002 :417-424.
5Pang B, Lee L, Vaithyanathan S. Thumbs up? Sentiment classification using machine learning Techniques [C] //Proc of 2002 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, USA: ACL, 2002: 79-86.
6Riloff E, Wiebe J. Learning extraction patterns for subjective expressions [C] //Proc of 2003 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, USA: ACL, 2003:105-112.
7Yu H, Hatzivassiloglou V. Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences [C] //Proe of 2003 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, USA: ACL, 2003: 129-136.
8Kanayama H, Nasukawa T. Fully automatic lexicon expansion for domain-oriented sentiment analysis [C] //Proc of 2006 Conf on Empirical Methods in Natural Language Processing. Stroudsburg, USA: ACL, 2006:355-363.
9Tang tluifeng, "Fan Songbo, Cheng Xueqi. A survey on sentiment detection of reviews [J]. Expert Systems with Applications, 2009, 36(7): 10760-10773.
10Dave K, Lawrence S, Pennock D. Mining the peanut gallery: Opinion extraction and semantic classification of product reviews [C] //Proc of llth lnt World Wide Web Conf. New York: ACM, 2002:519-528.

共引文献639

1包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
2王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
3王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：19
4刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
5徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：3
6张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29. 被引量：1
7安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
8蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.
9佘正炜,钱松荣.基于神经网络的文本倾向性分析系统的研究[J].微型电脑应用,2011(12):20-23. 被引量：2
10赵小永,赵政文.相关性计算在情感分析上的应用[J].微型电脑应用,2011(12):39-41.

同被引文献49

1翟延冬,王康平,张东娜,黄岚,周春光.一种基于WordNet的短文本语义相似性算法[J].电子学报,2012,40(3):617-620. 被引量：34
2赵建华.一种安全的基于分歧的半监督分类算法[J].西华大学学报（自然科学版）,2014,33(5):1-6. 被引量：2
3庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：466
4詹必胜,曾润喜,佘硕,葛镜.基于信息安全的网络图像舆情分析与识别研究[J].情报杂志,2015,34(2):7-12. 被引量：4
5张佳明,王波,唐浩浩,李天彩.基于Biterm主题模型的无监督微博情感倾向性分析[J].计算机工程,2015,41(7):219-223. 被引量：13
6刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：132
7欧阳继红,刘燕辉,李熙铭,周晓堂.基于LDA的多粒度主题情感混合模型[J].电子学报,2015,43(9):1875-1880. 被引量：23
8卜湛,伍之昂,曹杰,朱桂祥.在线评论情感计算与博弈预测[J].电子学报,2015,43(12):2530-2535. 被引量：13
9琚春华,鲍福光,戴俊彦.一种融入公众情感投入分析的微博话题发现与细分方法[J].电信科学,2016,32(7):97-105. 被引量：6
10朱宪莹,刘箴,金炜,刘婷婷,刘翠娟,柴艳杰.基于特征融合的层次结构微博情感分类[J].电信科学,2016,32(7):106-114. 被引量：6

引证文献4

1吕品,于文兵,汪鑫,计春雷,周曦民.异构分类器堆叠泛化及其在恶意评论检测中的应用[J].电子学报,2019,47(10):2228-2234. 被引量：3
2韩开旭,黎永壹,邱桂华,钱威.基于分段卷积神经网络的文本情感极性分析[J].计算机仿真,2020,37(6):361-364. 被引量：3
3顾秋阳,吴宝,琚春华.融入词汇共现的社交网络用户情感Biterm主题模型[J].电信科学,2020,36(11):47-60. 被引量：2
4王宇,李延晖.一种基于协同训练半监督的分类算法[J].华中师范大学学报（自然科学版）,2021,55(6):1020-1029. 被引量：5

二级引证文献13

1张雷,肖思瑶,杨泽来,王家琪.基于改进KNN算法与SIR模型的舆情处理研究[J].计算机仿真,2021,38(5):477-483. 被引量：10
2吴浩,潘善亮.基于BERT-RCNN的中文违规评论识别研究[J].中文信息学报,2022,36(1):92-103. 被引量：3
3郭晓春,马玉梅,曹萍萍.网络环境下考虑目标顾客偏好的服务产品选择方法[J].系统科学与数学,2022,42(7):1769-1787. 被引量：1
4汪瑞,魏利胜.基于特征融合与半监督协同训练随机森林的包装袋缺陷识别[J].安徽工程大学学报,2022,37(5):36-41.
5刘烨,吕锦涛.基于超像素与半监督的岩石图像分割与识别[J].工程科学与技术,2023,55(2):171-183. 被引量：5
6张秀全,李志伟,郑德聪,宋海燕,王国梁.基于近红外-可见光高光谱的堆叠泛化模型褐土有机质预测[J].光谱学与光谱分析,2023,43(3):903-910. 被引量：4
7阮光册,黄韵莹.融合Sentence-BERT和LDA的评论文本主题识别[J].现代情报,2023,43(5):46-53. 被引量：10
8肖芃,王耀宗.互动仪式视域下弹幕铸牢中华民族共同体意识研究[J].湖南师范大学社会科学学报,2023,52(6):127-133. 被引量：1
9胡建平,严永康.半监督学习算法下数字化信息归并分类仿真[J].计算机仿真,2023,40(12):502-505.
10叶海燕.基于卷积神经网络的特定目标文本情感分析模型[J].吉首大学学报（自然科学版）,2024,45(1):24-29.

1袁伯秋,周一民,李林.垃圾邮件处理中LDA特征选择方法[J].计算机工程与应用,2009,45(25):121-124. 被引量：1
2陈柯宇,何中市.基于情感词典的酒店评论情感分类研究[J].现代计算机,2017,23(4):3-6. 被引量：6
3严岳松,倪桂强,缪志敏,潘志松,汪肇强.基于SVDD的半监督入侵检测研究[J].微电子学与计算机,2009,26(10):128-130. 被引量：6
4秦玉平,陈一荻,王春立,王秀坤.一种新的类增量学习方法[J].计算机工程与应用,2011,47(34):181-183. 被引量：2
5袁伯秋,周一民,李林.LDA模型参数有偏估计方法[J].小型微型计算机系统,2010,31(4):647-650.
6高贤君,郑学东,刘子潇,杨元维.基于偏移阴影分析的高分辨率可见光影像建筑物自动提取[J].光学学报,2017,37(4):307-316. 被引量：14
7戴斌,李寿山,贡正仙,周国栋.基于多类型文本的半监督性别分类方法研究[J].山西大学学报（自然科学版）,2017,40(1):14-20. 被引量：4
8李雅林,张化祥,冯新营.一种新的基于半监督的多标记学习算法[J].山东大学学报（工学版）,2013,43(2):18-22.
9倪娜,刘凯,李耀东.科技文献关键词自动标注算法研究[J].计算机科学,2012,39(9):175-179. 被引量：2
10李秀香.浅析V-M调速控制系统信号极性的确定[J].电子技术与软件工程,2017(12):134-134.

电子学报

2017年第4期

浏览历史

内容加载中请稍等...

基于情感标签的极性分类被引量：4

参考文献6

二级参考文献69

共引文献639

同被引文献49

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于情感标签的极性分类 被引量：4

参考文献6

二级参考文献69

共引文献639

同被引文献49

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于情感标签的极性分类被引量：4