融合特征与注意力的跨领域产品评论情感分析被引量：4

Sentiment Analysis of Cross-Domain Product Reviews Based on Feature Fusion and Attention Mechanism

导出

摘要【目的】研究针对跨领域情感分类任务中标注数据资源相对匮乏以及从源领域到目标领域情感分类特征重要性区分问题。【方法】提出基于特征融合表示方法与注意力机制的跨领域双向长短时记忆产品评论情感分类模型,融合Bert词向量和跨领域词向量生成跨领域统一特征空间,通过双向长短时记忆网络结合注意力机制提取全局特征和局部特征的重要性权重。【结果】在亚马逊产品公开评论数据集上的对照实验结果表明,该模型跨领域评论情感分类平均准确率达到对照模型的最高值95.93%,比文献中对照模型最高准确率高出9.33%。【局限】需在多领域大规模数据集上进一步检验模型的泛化性,探究源领域知识对目标领域评论情感分类贡献规律。【结论】通过双向长短时记忆网络层学习融合特征能够有效获取情感语义信息,对照实验中对目标领域最有帮助的源领域基本一致。 [Objective] This paper tries to address the issues of labelled data shortage, aiming to distinguish the weights of sentiment characteristics in cross-domain sentiment classification. [Methods] We proposed a sentiment classification model for cross-domain product reviews based on feature fusion representation and the attention mechanism. First, this model integrated Bert and cross-domain word vectors to generate cross-domain unified feature space. Then, it extracted the weights of global and local features through attention mechanism. [Results]We examined our model with public review data from Amazon and found the average accuracy of the proposed model was up-to 95.93%, which was 9.33% higher than the existing model. [Limitations] More research is needed to evaluate our model with large-scale multi-domain data sets. [Conclusions] The proposed model could effectively analyze sentiment information.

作者祁瑞华简悦郭旭关菁华杨明昕 Qi Ruihua;Jian Yue;Guo Xu;Guan Jinghua;Yang Mingxin(Research Center for Language Intelligence,Dalian University of Foreign Languages,Dalian 116044,China;School of Software Engineering,Dalian University of Foreign Languages,Dalian 116044,China)

机构地区大连外国语大学语言智能研究中心大连外国语大学软件学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第12期85-94,共10页 Data Analysis and Knowledge Discovery

基金辽宁省高等学校创新人才项目(项目编号:WR2019005) 国家社会科学基金一般项目“典籍英译国外读者网上评论观点挖掘研究”(项目编号:15BYY028) 辽宁省社科规划基金一般项目“大数据环境下突发事件谣言预警研究”(项目编号:L17BTQ005)的研究成果之一。

关键词特征融合注意力机制跨领域情感分类 Feature Fusion Attention Mechanism Cross-Domain Sentiment Classification

分类号 TP393 [自动化与计算机技术—计算机应用技术] G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献1

1余传明.基于深度循环神经网络的跨领域文本情感分析[J].图书情报工作,2018,62(11):23-34. 被引量：22

二级参考文献10

1徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：107
2马凤闸,吴江宁,杨光飞.基于双重选择策略的跨领域情感倾向性分析[J].情报学报,2012,31(11):1202-1209. 被引量：5
3吕韶华,杨亮,林鸿飞.基于SimRank的跨领域情感倾向性分析算法研究[J].中文信息学报,2012,26(6):38-44. 被引量：6
4张志武.跨领域迁移学习产品评论情感分析[J].现代图书情报技术,2013(6):49-54. 被引量：6
5魏现辉,张绍武,杨亮,林鸿飞.基于加权SimRank的跨领域文本情感倾向性分析[J].模式识别与人工智能,2013,26(11):1004-1009. 被引量：11
6吴斐,张玉红,胡学钢.面向评论信息的跨领域词汇情感倾向判别方法[J].计算机科学,2015,42(6):220-222. 被引量：2
7吴应良,黄媛,王选飞.在线中文用户评论研究综述:基于情感计算的视角[J].情报科学,2017,35(6):159-163. 被引量：18
8冯超,梁循,李亚平,周小平,李晓菲.基于词向量的跨领域中文情感词典构建方法[J].数据采集与处理,2017,32(3):579-587. 被引量：13
9黄瑞阳,康世泽.一种改进EM算法的跨领域情感分类方法[J].计算机应用研究,2017,34(9):2696-2699. 被引量：2
10余传明,冯博琳,安璐.基于深度表示学习的跨领域情感分析[J].数据分析与知识发现,2017,1(7):73-81. 被引量：7

共引文献21

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：5
3余传明,原赛,王峰,安璐.大数据环境下文本情感分析算法的规模适配研究:以Twitter为数据源[J].图书情报工作,2019,63(4):101-111. 被引量：13
4邵珊珊,王立非.基于语言大数据挖掘的电商英汉评价话语情感分析[J].外语电化教学,2019(5):76-84. 被引量：13
5王晰巍,邢云菲,韦雅楠,王铎.大数据驱动的社交网络舆情用户情感主题分类模型构建研究——以“移民”主题为例[J].信息资源管理学报,2020,10(1):29-38. 被引量：20
6胡赫薇,冯晓曦.基于Bi-LSTM的财金文本情感分类研究[J].电脑与信息技术,2020,28(2):35-37. 被引量：2
7熊回香,杨梦婷,李玉媛.基于深度学习的信息组织与检索研究综述[J].情报科学,2020,38(3):3-10. 被引量：16
8何然.情绪在国际商务谈判中的应用:情感计算视角[J].中国商论,2020(14):82-84. 被引量：1
9陆智贤.大数据视角下基于深度学习的负面口碑情感评估研究[J].中国集体经济,2020(27):82-83.
10余传明,王峰,安璐.基于深度学习的跨语言词汇对齐模型研究[J].情报理论与实践,2020,43(9):150-158. 被引量：3

同被引文献45

1程亮,邱云飞,孙鲁.微博谣言检测方法研究[J].计算机应用与软件,2013,30(2):226-228. 被引量：23
2李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：83
3梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91
4李宗建,程竹汝.新媒体时代舆论引导的挑战与对策[J].上海行政学院学报,2016,17(5):76-85. 被引量：67
5吴维芳,高宝俊,杨海霞,孙含琳.评论文本对酒店满意度的影响:基于情感分析的方法[J].数据分析与知识发现,2017,1(3):62-71. 被引量：33
6祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：20
7杨文太,梁刚,谢凯,杨进,许春.基于突发话题和领域专家的微博谣言检测方法[J].计算机应用,2017,37(10):2799-2805. 被引量：13
8黄亚驹,陈福集,游丹丹.基于混合算法和BP神经网络的网络舆情预测研究[J].情报科学,2018,36(2):24-29. 被引量：26
9周瑛,刘越,蔡俊.基于注意力机制的微博情感分析[J].情报理论与实践,2018,41(3):89-94. 被引量：44
10陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：39

引证文献4

1谭坤彦,杨孔雨.基于神经网络的舆情情感分析研究热点与趋势——基于CiteSpace的可视化分析[J].智能计算机与应用,2022,12(8):33-42. 被引量：6
2商丽丽,唐华云,王延昭,左美云.在线评论可行动信息识别研究[J].数据分析与知识发现,2022,6(12):1-12. 被引量：1
3王昊,龚丽娟,周泽聿,范涛,王永生.融合语义增强的社交媒体虚假信息检测方法研究[J].数据分析与知识发现,2023,7(2):48-60. 被引量：6
4王桂江,黄润才,黄勃.基于K-BERT和残差循环单元的中文情感分析[J].数据与计算发展前沿,2023,5(4):127-138. 被引量：3

二级引证文献16

1叶强,詹宝强,马笑晨,李永立.基于文本挖掘和多模块融合的金融数据分类分级方法[J].信息技术与管理应用,2022(1):120-133.
2方茜.基于XGBoost的网络舆情文章预警模型建立[J].智能计算机与应用,2023,13(6):72-77. 被引量：2
3陈赛飞扬,殷锋,李泽宇,王小雪.基于历史文化知识图谱的问答模型研究[J].西南民族大学学报(自然科学版),2023,49(6):679-685.
4李晓,徐晓雨.我国社交网络舆情研究的热点与趋势——基于CiteSpace的可视化分析[J].电脑知识与技术,2023,19(32):4-7.
5廖劲智,赵和伟,连小童,纪文亮,石海明,赵翔.基于对比图学习的跨文档虚假信息检测[J].计算机科学,2024,51(3):14-19.
6宋奇书,于红,乔诗晗,罗璇,李光宇,邵立铭,张思佳.基于改进BiRTE的渔业健康养殖标准复杂关系抽取[J].大连海洋大学学报,2024,39(1):153-161.
7汪珶.基于知识蒸馏改进双路BERT的经济类文本情感分析[J].山西师范大学学报（自然科学版）,2024,38(1):39-44.
8潘文新,朱荣.国内外癫痫检测热点及趋势分析[J].曲阜师范大学学报（自然科学版）,2024,50(2):100-106.
9张伟,徐宗煌,蔡鸿宇,韩普,石进.基于情感增强和知识融合的在线健康社区情感分析研究[J].数据分析与知识发现,2024,8(3):53-62. 被引量：2
10李敏.智能网联汽车技术专业现状及发展对策研究[J].交通职业教育,2024(1):34-40.

1肖璐,赵之辉,陈果.全局视角下的网络社区多元知识关联挖掘[J].图书情报工作,2020,64(6):100-107. 被引量：4
2章乐,朱娅霖.自然语言中词汇的信息获取:改进的skip-gram模型[J].北京电子科技学院学报,2020(2):19-26. 被引量：1
3许朝祥,丁祖敏.江苏句容:建设财政大数据平台[J].新理财（政府理财）,2021(1):64-65. 被引量：1
4董修青.读书笔记助力海量阅读[J].湖北教育,2020(12):59-59.
5王佳宜.长江经济带重点生态功能区生态补偿减贫效应研究初探[J].现代经济信息,2021(1):190-191.
6陈自豪,陈松航,陈豪.多种群NSGA-Ⅱ改进算法的大规模柔性作业车间调度问题[J].传感器与微系统,2021,40(2):51-54. 被引量：4
7刘月林,赵玲玲,李嘉玲.基于Kano模型与FAHP分析的滑雪护腕设计与评价[J].包装工程,2021,42(4):148-153. 被引量：15
8周影,褚丽莉,陈佳.一种对抗全局窃听的网络编码方案[J].通信技术,2021,54(1):164-168.
9王炜,陈熙仁,余灯广,邵军.傅里叶变换红外拉曼光谱检测半导体薄膜下衬底特性[J].红外与毫米波学报,2021,40(1):50-55. 被引量：1

数据分析与知识发现

2020年第12期

浏览历史

内容加载中请稍等...

融合特征与注意力的跨领域产品评论情感分析被引量：4

参考文献1

二级参考文献10

共引文献21

同被引文献45

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

融合特征与注意力的跨领域产品评论情感分析 被引量：4

参考文献1

二级参考文献10

共引文献21

同被引文献45

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

融合特征与注意力的跨领域产品评论情感分析被引量：4