基于字句动态特征和自注意力的情感分析方法

Emotional Analysis Approach Based on Dynamic Word-Sentence Features and Self attention

下载PDF

导出

摘要针对评论情感分析任务中文本长度失衡引起的特征稀疏、特征缺失和提取信息不全等问题,提出了一种基于字句动态特征和自注意力的情感分析方法。首先基于预训练模型对评论进行动态特征编码,使用句向量对不足固定长度的部分进行补全,并表征超出的截断部分,以缓解批训练下文本尺寸失衡引起的特征稀疏和特征缺失问题。然后使用基于自注意力机制的特征重组方法动态整合字句融合特征,并优化权重参数以降低计算和训练时间复杂度。最后在开源数据集上分别进行了消融实验和对比实验。测试结果表明,本文方法在准确率上有较优的改进效果。 Traditional models suffer from feature sparsity,feature loss and incomplete comment feature extraction problems due to the imbalance of comment length.This paper proposes an emotional analysis approach based on dynamic word-sentence features and self-attention(DWSF-SA),to alleviate the incomplete extraction problem caused by the imbalance of text size under batch training.DWSF-SA first follows pre-training on dynamic feature embedding,then employs sentence vectors to complete the less parts and represents the truncated parts by fixed length.Moreover,DWSF-SA also introduces a selfattention mechanism to dynamically integrate the word-sentence fusion features,and makes optimization on the weight parameters to accelerate the computation and training.The ablation and comparison experiments on publicly available datasets demonstrate that the proposed DWSF-SA outperforms traditional approaches in accuracy metrics.

作者刘强朱金森赵龙龙沙宇晨刘尚东季一木 LIU Qiang;ZHU Jinsen;ZHAO Longlong;SHA Yuchen;LIU Shangdong;JI Yimu(School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;Institute of High Performance Computing and Big Data Processing,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

机构地区南京邮电大学计算机学院南京邮电大学高性能计算与大数据处理研究所

出处《数据采集与处理》 CSCD 北大核心 2024年第1期193-203,共11页 Journal of Data Acquisition and Processing

基金国家重点研发计划专项(2018AAA0103300,2018AAA0103302) 江苏省自然科学及高校自然科学重大项目(BK20170900,20KJA520001) 江苏省创新创业人才项目及江苏博士后基金(2019K024) 江苏省六大人才高峰项目(JY02) 江苏省博士后研究实践创新项目(KYCX19_0921,KYCX19_0906) 之江实验室开放项目(2021KF0AB05) 教育部人文社会科学基金青年项目(20YJC880104) 南京邮电大学人才启动基金(NY219132)。

关键词情感分析特征编码预训练模型自注意力机制权重参数 emotional analysis feature embedding pre-training model self-attention mechanism weight parameters

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1杜朋,卢益清,韩长风.基于Transformer模型的商品评论情感分析[J].中文信息学报,2021,35(2):125-132. 被引量：8
2程艳,孙欢,陈豪迈,李猛,蔡盈盈,蔡壮.融合卷积神经网络与双向GRU的文本情感分析胶囊模型[J].中文信息学报,2021,35(5):118-129. 被引量：10
3王勇,张索宇,吕心怡.多重注意力特征融合网络对中文评价情感分析[J].小型微型计算机系统,2021,42(8):1633-1638. 被引量：3
4景丽,何婷婷.基于改进TF-IDF和ABLCNN的中文文本分类模型[J].计算机科学,2021,48(S02):170-175. 被引量：24
5李铁飞,生龙,吴迪.BERT-TECNN模型的文本分类方法研究[J].计算机工程与应用,2021,57(18):186-193. 被引量：20
6程艳,尧磊波,张光河,唐天伟,项国雄,陈豪迈,冯悦,蔡壮.基于注意力机制的多通道CNN和BiGRU的文本情感倾向性分析[J].计算机研究与发展,2020,57(12):2583-2595. 被引量：43
7苏锦钿,欧阳志凡,余珊珊.基于依存树及距离注意力的句子属性情感分类[J].计算机研究与发展,2019,56(8):1731-1745. 被引量：12
8胡艳丽,童谭骞,张啸宇,彭娟.融入自注意力机制的深度学习情感分析方法[J].计算机科学,2022,49(1):252-258. 被引量：15
9赵京胜,宋梦雪,高祥,朱巧明.自然语言处理中的文本表示研究[J].软件学报,2022,33(1):102-128. 被引量：51
10谢润忠,李烨.基于BERT和双通道注意力的文本情感分类模型[J].数据采集与处理,2020,35(4):642-652. 被引量：27

二级参考文献88

1张政馗,庞为光,谢文静,吕鸣松,王义.面向实时应用的深度学习研究综述[J].软件学报,2020(9):2654-2677. 被引量：36
2张嵩,杨晓明,田露.基于语义相似度计算的航天标准关联度评价[J].南京航空航天大学学报,2021,53(S01):153-156. 被引量：3
3张秋颖,傅洛伊,王新兵.基于BERT-BiLSTM-CRF的学者主页信息抽取[J].计算机应用研究,2020,37(S01):47-49. 被引量：14
4查朝晖,刘海涛.航天术语标准化的研究与探讨[J].航天标准化,1999,0(3):3-7. 被引量：3
5徐通锵.“字本位”和语言研究[J].语言教学与研究,2005(6):1-11. 被引量：56
6姚天昉,娄德成.汉语语句主题语义倾向分析方法的研究[J].中文信息学报,2007,21(5):73-79. 被引量：78
7孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔.斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根.依布拉音,刘群,刘知远.语言计算的重要国际前沿[J].中文信息学报,2014,28(1):1-8. 被引量：23
8李枫林,柯佳.基于深度学习的文本表示方法[J].情报科学,2019,37(1):156-164. 被引量：19
9李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：83
10刘龙飞,杨亮,张绍武,林鸿飞.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报,2015,29(6):159-165. 被引量：96

共引文献213

1郑杏冉,黄卫东.网民心理视角下突发公共事件情感主题研究[J].知识管理论坛,2024(1):93-107.
2林海香,赵正祥,陆人杰,卢冉,白万胜,胡娜娜.基于字词融合的高铁道岔多级故障诊断组合模型[J].电子测量与仪器学报,2022,36(10):217-226. 被引量：2
3张苑,祝小兰,杨东晓.基于深度学习的疫情情感分析[J].智能计算机与应用,2022,12(3):40-45. 被引量：1
4汪欣,张铭毅,刘亚萍.精准推荐技术的工作逻辑和前沿应用[J].传媒论坛,2022,5(16):16-18.
5陶全桧,安俊秀,陈宏松.基于跨模态融合ERNIE的多模态情感分析研究[J].成都信息工程大学学报,2022,37(5):501-507. 被引量：1
6温志强,刘楠.从单向线性到迭代闭环:重大公共决策网络舆情风险研判体系构建[J].上海行政学院学报,2021,22(4):30-42. 被引量：9
7胡蕾.狄奥尼索斯的报复——《蝇王》之神话原型分析与重释[J].山东外语教学,2000,21(2):49-53. 被引量：13
8张国方,寇姣姣,陈令华.网络评论文本驱动的汽车设计规划方法[J].机械设计,2021,38(2):139-144. 被引量：11
9蔡汶兴,李兴东.基于BERT模型的景区评论情感分析[J].贵州大学学报（自然科学版）,2021,38(2):57-60. 被引量：2
10金华涛.基于BERT模型和双通道注意力的短文本情感分析方法[J].信息与电脑,2021,33(5):41-43.

1梁启超.梁启超语录[J].郑州大学学报（哲学社会科学版）,2023,56(5):1-1.
2贾俣,梅芳,孙鹏.基于先验信息动态整合的软件可靠性验证仿真[J].计算机仿真,2023,40(10):377-380.
3张旭.“层进”理论视域下文学阅读与创意表达任务群教学设计——以七下第一单元为例[J].语文教学通讯,2024(6):31-33.
4徐小容,杨雨倩.从定界封闭到跨界共生:高中阶段职普融通的可能与可为[J].中国职业技术教育,2023(36):59-67. 被引量：3
5廖辉.连铸结晶器内部结构对结晶效果的影响分析[J].冶金与材料,2024,44(1):160-162.
6梁芝宁,张春泉.绵阳方言的有标记被动句研究[J].湖北理工学院学报（人文社会科学版）,2024,41(1):85-94.
7王珏.重新认识《马氏文通》助字卷的得失[J].汉语学报,2024(1):97-108.
8许林玉(编译).卡利安普迪·拉奥(1920—2023)[J].世界科学,2024(1):64-64.
9余丹.宗璞:兰之气息,玉之精神[J].语文世界（中旬刊）,2017(10):8-8.
10秦云飞,崔晓龙,程林,樊继东.融合多层次浅层信息的航拍小目标检测[J].计算机系统应用,2024,33(2):176-187.

数据采集与处理

2024年第1期

浏览历史

内容加载中请稍等...

基于字句动态特征和自注意力的情感分析方法

参考文献12

二级参考文献88

共引文献213

相关作者

相关机构

相关主题

浏览历史