-
题名加入梯度均衡机制的端到端方面级情感分析
- 1
-
-
作者
罗涵天
杨雅婷
马博
董瑞
李晓
-
机构
中国科学院新疆理化技术研究所多语种信息技术实验室
中国科学院大学计算机科学与技术学院
中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
-
出处
《计算机工程与设计》
北大核心
2023年第8期2555-2560,F0003,共7页
-
基金
中国科学院青年创新促进会基金项目(科发人函字[2019]26号)
国家自然科学基金项目(U2003303)
+3 种基金
国家重点研发计划基金项目(2017YFC0822505-4)
新疆天山创新团队基金项目(2020D14045)
天山青年优秀青年科技人才基金项目(2019Q031)
中国科学院西部青年学者B类基金项目(2019-XBQNXZ-B-008)。
-
文摘
目前方面级情感分析任务存在类别标签不平衡的问题,会导致模型过多学习非方面词标签,影响模型的性能。基于BERT端到端方面级情感分类模型,针对其类别标签不平衡的问题进行深入研究,提出使用梯度均衡机制缓解类别标签不平衡的问题,采用指数滑动平均的方法缓解潜在离群点样本对实验结果造成的影响,提升模型的性能。在4个标准数据集中进行实验,实验结果表明,所提方法在实验结果中(F1值)相比许多强基线方法有较为明显提升。
-
关键词
梯度均衡
端到端
方面级
情感分析
不平衡
标签
离群点
-
Keywords
gradient harmonized mechanism
end-to-end
aspect-based
sentiment analysis
unbalanced
label
outlier
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于短语的阿拉伯语到中文的机器翻译系统
被引量:3
- 2
-
-
作者
李凯
郑洁
蒋同海
-
机构
中国科学院新疆理化技术研究所多语种信息技术实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第6期2306-2309,共4页
-
基金
新疆自治区科技攻关(含重大专项)和重点资助项目(200732143-1)
-
文摘
使用基于短语的统计翻译方法,搭建了一个简易的阿拉伯语到中文的翻译系统。核心的解码器采用了log-linear直接翻译模型进行开发,在系统中使用了大量的开源软件进行语料库的预处理,并讨论了该方向上尚未解决的问题和未来的发展趋势。
-
关键词
短语
统计翻译
阿拉伯语
log-linear
解码
-
Keywords
phrase
statistical translation
Arabic
log-linear
decoder
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-