摘要
提出了一种基于情感分布的emoji嵌入式表示方法(emoji embedded representation based on emotion distribution,EDEER)。EDEER方法采用基于BERT的情绪预测模型软标签,从真实数据中学习emoji嵌入式表示,通过情感分布直接建模emoji在各种情绪上的表达程度,使嵌入式表示中包含emoji的多种情感信息。在包含emoji的中文微博数据集上的多组对比实验表明,本文提出的方法可以有效地学习到与细粒度情绪直接关联的emoji嵌入式表示,构建具有较高情绪表达质量的emoji表示空间。
This paper proposes an emoji embedded representation based on emotion distribution(EDEER)method.The EDEER method adopts the soft label of BERT-based emotion prediction model to learn emoji embedded representation from real data,and directly models the expression degree of emoji on various sentiments through emotion distribution,so that the embedded representation contains various emotional information of emoji.Multiple sets of comparative experiments on the Chinese Weibo dataset containing emoji shows that the method proposed in this paper can effectively learn emoji embedded representations that are directly related to fine-grained sentiments,and build an emoji representation space with high emotional expression quality.
作者
曾雪强
孙雨
刘烨
万中英
左家莉
王明文
Xueqiang ZENG;Yu SUN;Ye LIU;Zhongying WAN;Jiali ZUO;Mingwen WANG(School of Computer&Information Engineering,Jiangxi Normal University,Nanchang 330022,Jiangxi,China)
出处
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2024年第3期81-94,共14页
Journal of Shandong University(Natural Science)
基金
国家自然科学基金资助项目(62266021)
江西省教育厅科学技术研究项目(GJJ2200330)。
关键词
emoji
情绪分析
嵌入式表示
情感分布
emoji
sentiment analysis
embedded representation
emotion distribution