-
题名基于DPCNN和多学习模式损失的富上下文反讽识别
- 1
-
-
作者
刘畅
朱焱
-
机构
西南交通大学计算机与人工智能学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第S02期31-35,共5页
-
基金
四川省科技计划(2019YFSY0032)。
-
文摘
反讽作为一种层次丰富且复杂的语言表达方式,广泛存在于人们的日常表达和社交平台中。在电子商务、事件话题分析等方面,准确检测评论文本是否具有反讽意图对判断评论者情感倾向、对评论主体的好恶至关重要。研究针对会话上下文、用户上下文、主题上下文这3类反讽上下文语境,构建上下文语境丰富的反讽检测模型。针对传统浅层CNN难以捕获句子远距离依赖的问题,所提模型引入DPCNN架构捕获语句远程关联信息,并融合双向注意力机制学习会话上下文中的不协调信息。考虑到现实的数据样本中反讽类型数量少、反讽表达层次不均衡,还提出一种多学习模式的非对称损失函数,来解决样本类别不平衡、难易样本优先学习的问题。通过在3个公开反讽数据集上进行验证实验,结果表明所提模型在ACC、F1和AUC指标上均优于基准模型,最高超出2.5%。消融实验证明所提模型各个模块以及多学习模式损失函数均能提升反讽检测的性能。
-
关键词
反讽检测
富上下文
双向注意力
不协调
非对称损失
-
Keywords
Sarcasm detection
Context-rich
Bidirectional attention
Incongruity
Asymmetric loss
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-