结合表示学习和迁移学习的跨领域情感分类被引量：9

Cross-Domain Sentiment Classification Based on Representation Learning and Transfer Learning

下载PDF

导出

摘要针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分层注意力网络,对文本中重要单词与句子的情感信息进行建模,从而学习源领域与目标领域的文档级分布式表示。随后,采用类噪声估计方法,对源领域中的迁移数据进行检测,剔除负面迁移样例,挑选高质量样例来扩充目标领域的训练集。最后,训练支持向量机对目标领域文本进行情感分类。在大规模公开数据集上进行的两个实验结果表明,与基准方法相比,所提方法的均方根误差分别降低1.5%和1.0%,说明该方法可以有效地提高跨领域情感分类性能。 Most of existing cross-domain sentiment classification methods are not expressive enough to capture rich representation of texts,and class noise accumulated during transfer process would lead to negative transfer which could adversely affect performance.To address these issues,the authors propose a method combining textual representation learning and transfer learning algorithm for cross-domain sentiment classification.This method first builds a hierarchical attention network to generate document representations with local semantic information.Afterwards,the authors utilize the class-noise estimation algorithm to detect the negative transfer samples in transferred samples and remove them.Finally,the sentiment classifier is trained on the expanded dataset from samples in target domain and transferred ones in source domain.Compared with the baselines,two experiments on large-scale product review datasets show that the proposed method is able to effectively reduce RMSE of crossdomain sentiment classification by 1.5%and 1.0%respectively.

作者廖祥文吴晓静桂林黄锦辉陈国龙 LIAO Xiangwen;WU Xiaojing;GUI Lin;HUANG Jinhui;CHEN Guolong(School of Mathematics and Computer Science,Fuzhou University,Fuzhou 350116;Fujian Provincial Key Laboratory of Networking Computing and Intelligent Information Processing(Fuzhou University),Fuzhou,350116;Fujian Provincial Key Laboratory of Information Processing and Intelligent Control(Minjiang University),Fuzhou,350116;Department of Systems Engineering and Engineering Management,The Chinese University of Hong Kong,Hong Kong)

机构地区福州大学数学与计算机科学学院福建省网络计算与智能信息处理重点实验室(福州大学) 福建省信息处理与智能控制重点实验室(闽江学院) 香港中文大学系统工程与工程管理学系

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2019年第1期37-46,共10页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家自然科学基金(61772135 U1605251) 中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201708 CASNDST201606) 可信分布式计算与服务教育部重点实验室主任基金(2017KF01) 赛尔网络下一代互联网技术创新项目(NGII20160501)资助

关键词文本表示学习迁移学习类噪声估计跨领域情感分类 textual representation learning transfer learning class-noise estimation cross-domain sentiment classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吴冬茵,桂林,陈钊,徐睿峰.基于深度表示学习和高斯过程迁移学习的情感分析方法[J].中文信息学报,2017,31(1):169-176. 被引量：13
2张浩然,韩正之,李昌刚.支持向量机[J].计算机科学,2002,29(12):135-137. 被引量：72

二级参考文献2

1He Xiangning Yang Yuwen (Dept of Electrical Eng., Zhejiang University, Hangzhou 310027)Kuang Sheng(Department of Engineering, University of Cambridge, Cambridge, U.K.)Barry W. Williams Stephen J. Finney(Dept. of Computing & Electrical Eng., Heriot-Watt University, Edinburgh EH14 4AS, U.K.).COMPOSITE SOFT SWITCHING CONFIGURATION FOR INVERTERS USING BRIDGE LEG MODULES[J].Journal of Electronics(China),2001,18(1):61-69. 被引量：7
2张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2273

共引文献83

1周叶,唐澍,潘罗平,夏伟.基于支持向量机的水电机组轴系运行故障诊断及预测研究[J].水利学报,2013,44(S1):111-115. 被引量：11
2姜琪文,许强,何政伟.基于SVM多类分类的滑坡区域危险性评价方法研究[J].地质灾害与环境保护,2005,16(3):328-330. 被引量：13
3梁志荣.应用于数据挖掘分类算法的SVM研究[J].福建电脑,2007,23(6):41-41.
4张巨勇,施浒立,王伟,陈志平.基于LS-SVM的天线指向模型研究[J].电波科学学报,2007,22(5):804-809. 被引量：2
5邬世英,王延江,李莉,胡加山,冯国志,阎汉杰.支持向量机在重震联合反演中的应用研究[J].地球物理学进展,2007,22(5):1611-1616. 被引量：11
6李丹,高立群,王珂,黄越.基于动态多种群粒子群支持向量机的短期负荷预测[J].计算机科学,2008,35(7):133-136. 被引量：7
7袁红春,黎莹,熊范纶.一种新的面向渔情预测的智能数据处理模型研究[J].计算机应用研究,2009,26(12):4520-4522. 被引量：3
8刘超,卢玲,胡晓利.数字土壤质地制图方法比较——以黑河张掖地区为例[J].遥感技术与应用,2011,26(2):177-185. 被引量：14
9常青,赵晓莉.时间序列模型在降水量预测中的应用研究[J].计算机仿真,2011,28(7):204-206. 被引量：18
10伍家驹,刘文.PI调节器设计的可视化算法[J].计算机仿真,2011,28(7):272-276. 被引量：1

同被引文献62

1杨春节,童晟,孙长生,宋执环.基于可靠度约束的混合预防性维修模型[J].浙江大学学报（工学版）,2008,42(8):1376-1379. 被引量：18
2公茂果,焦李成,杨咚咚,马文萍.进化多目标优化算法研究[J].软件学报,2009,20(2):271-289. 被引量：399
3曹敏,程东年,张建辉,吴曦.基于自适应阈值的网络流量异常检测算法[J].计算机工程,2009,35(19):164-166. 被引量：24
4张宾,杨家海,吴建平.Internet流量模型分析与评述[J].软件学报,2011,22(1):115-131. 被引量：93
5吴增强.论有效教学的心理学支持——信息加工学习论的启示[J].教育发展研究,2011,31(4):39-42. 被引量：6
6赵立影,吴庆麟.基于知识反转效应的多媒体学习环境设计[J].中国电化教育,2012(1):86-89. 被引量：8
7庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：468
8赵传君,王素格,李德玉,李欣.基于分组提升集成的跨领域文本情感分类[J].计算机研究与发展,2015,52(3):629-638. 被引量：12
9何侃,田亚清,李强,胡洲荣,张静.基于LD3320的语音识别智能垃圾桶设计[J].国外电子测量技术,2015,34(6):85-88. 被引量：54
10郭文强,张宝嵘,彭程,夏令君,佘金龙.基于小波包和BN模型的深沟球轴承故障诊断[J].轴承,2016(3):48-52. 被引量：8

引证文献9

1胡均毅,李金龙.基于情感评分的分层文本表示情感分类方法[J].计算机工程,2020,46(3):46-52. 被引量：6
2康庄,杨杰,郭濠奇.基于机器视觉的垃圾自动分类系统设计[J].浙江大学学报（工学版）,2020,54(7):1272-1280. 被引量：57
3刘慧清,郭延哺,李维华.基于贝叶斯网的跨领域情感分析方法[J].计算机应用与软件,2020,37(12):119-126. 被引量：4
4郭文强,徐成,肖秦琨,李梦然.基于变权重迁移学习的BN参数学习算法[J].计算机应用研究,2021,38(1):110-114. 被引量：6
5刘璐,蒋艳.基于迁移学习的NSGAⅡ算法[J].软件导刊,2021,20(3):134-138. 被引量：1
6李海明,陈萍.基于迁移学习的电力短文本情感分类研究[J].上海电力大学学报,2021,37(4):407-413. 被引量：3
7刘锐,安桂颍.学生认知思维中的“多任务加工”学习行为[J].教育理论与实践,2021,41(26):51-53.
8李荣宽,丁乙,王寒凝,贺宁.基于小样本学习的网络异常流量检测[J].指挥信息系统与技术,2024,15(2):88-93.
9王佳炎,毛耀增,郭兰鑫,贾富昊,姜麒,史昊东,周德强.一种基于机器视觉的多垃圾自动分类机器设计[J].机械,2024,51(8):66-71.

二级引证文献77

1何永勃,李明伟.基于循环神经网络的飞机货舱火灾快速识别算法[J].消防科学与技术,2020(11):1490-1494. 被引量：4
2郑宜健,孟小源,申文元,陈广庆.基于机器视觉的景区智能垃圾桶设计[J].机械设计,2024,41(S01):43-50.
3杨寿勇,张海阳,李成,李静,张学治.基于卷积神经网络模型的微藻种类识别[J].环境科学与技术,2020(S02):158-164. 被引量：6
4刘婷,周柏均,赵永生,时雷雨.基于卷积神经网络的无人船海面垃圾分类算法[J].船舶工程,2021,43(S01):399-404. 被引量：11
5张霞.我国城市生活垃圾分类措施失败成因及对策研究[J].中国科技投资,2020(18):14-15.
6陆利军,廖小平.基于UGC数据的南岳衡山旅游目的地形象感知研究[J].经济地理,2019,39(12):221-229. 被引量：80
7王姝,关展旭,王晶,孙晓辉.基于迁移学习的贝叶斯网络参数学习方法[J].东北大学学报（自然科学版）,2021,42(4):509-515. 被引量：5
8王鹏程,胡宏亮,杨旭.基于CATIA建模的多功能智能垃圾桶设计[J].机电工程技术,2021,50(3):146-148. 被引量：3
9曾伟业,周婷婷,孟飞荣.垃圾分类小程序用户满意度影响因素探究[J].合作经济与科技,2021(10):60-63. 被引量：1
10张雅楠,丁治中,舒诗琦,陈俊,胡娇.塑料垃圾智能回收装置的设计研究[J].科学技术创新,2021(13):194-196. 被引量：2

1岳天驰,张绍武,杨亮,林鸿飞,于凯.基于两阶段注意力机制的立场检测方法[J].广西师范大学学报（自然科学版）,2019,37(1):42-49. 被引量：10
2沈炜域,刘奇飞.利用概念化的少样本短文本分类研究[J].情报探索,2018(12):5-9. 被引量：1
3张刚强,刘群,纪良浩.基于序贯三支决策的多粒度情感分类方法[J].计算机科学,2018,45(12):153-159. 被引量：12
4费城.异乡、广场和锯木厂(组诗)[J].陕西文学,2018,0(6):138-140.
5赵传君,王素格,李德玉.基于集成深度迁移学习的多源跨领域情感分类[J].山西大学学报（自然科学版）,2018,41(4):709-717. 被引量：4
6张庆林,杜嘉晨,徐睿峰.基于对抗学习的讽刺识别研究[J].北京大学学报（自然科学版）,2019,55(1):29-36. 被引量：7
7王永祥.云迁移策略研究[J].电子世界,2019,0(1):34-35.
8朱晓亮,石昀东.基于TextRank和字符级卷积神经网络的小学作文素材自动分类模型研究[J].计算机应用与软件,2019,36(1):220-226. 被引量：7
9王超,彭湃,李波.舆情短文本挖掘的数学模型及其实现[J].数学建模及其应用,2018,7(3):29-36. 被引量：2
10屈庆涛,刘其成,牟春晓.基于N-Gram语言模型的并行自适应新闻话题追踪算法[J].山东大学学报（工学版）,2018,48(6):37-43. 被引量：10

北京大学学报（自然科学版）

2019年第1期

浏览历史

内容加载中请稍等...

结合表示学习和迁移学习的跨领域情感分类被引量：9

参考文献2

二级参考文献2

共引文献83

同被引文献62

引证文献9

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

结合表示学习和迁移学习的跨领域情感分类 被引量：9

参考文献2

二级参考文献2

共引文献83

同被引文献62

引证文献9

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

结合表示学习和迁移学习的跨领域情感分类被引量：9