基于高困惑样本对比学习的隐式篇章关系识别被引量：1

Contrastive Learning with Confused Samples for Implicit Discourse Relation Recognition

下载PDF

导出

摘要隐式篇章关系识别是一种自动判别论元语义关系的自然语言处理任务。该任务蕴含的关键科学问题涉及两个方面:其一是准确表征论元语义;其二是基于语义表示,有效地判别论元之间的关系类型。该文将集中在第一个方面开展研究。精准可靠的语义编码有助于关系分类,其根本原因是,编码表示的可靠性促进了正负例样本的可区分性(正例样本特指一对蕴含了“目标关系类”的论元,负例则是一对持有“非目标关系类”的论元)。近期研究显示,集成对比学习机制的语义编码方法能够提升模型在正负例样本上的可辨识性。为此,该文将对比学习机制引入论元语义的表示学习过程,利用“对比损失”驱动正负例样本的“相异性”,即在语义空间中聚合同类正样本,且驱散异类负样本的能力。特别地,该文提出基于条件自编码器的高困惑度负例生成方法,并利用这类负例增强对比学习数据的迷惑性,提升论元语义编码器的鲁棒性。该文使用篇章关系分析的公开语料集PDTB进行实验,实验结果证明,上述方法相较于未采用对比学习的基线模型,在面向对比(Comparison)、偶然(Contingency)、扩展(Expansion)及时序(Temporal)四种PDTB关系类型的二元分类场景中,分别产生了4.68%、4.63%、3.14%、12.77%的F 1值性能提升。 Implicit discourse relation recognition automatically identifies the semantic relation between arguments.The key to this task involves two issues:one is to represent the argument semantics,the other is to recognize the relation between arguments.Focusing on better representation of the arguments,this paper introduces the contrast learning into the process of argument representation learning.We further propose a method generating confused samples based on conditional auto-encoders,so as to enhance the confused data in contrastive learning.Experiments on the Penn Discourse Treebank(PDTB)corpus show that,our method increases F 1 score by 4.68%,4.63%,3.14%and 12.77%on four top relations(Comparison,Contingency,Expansion,and Temporal),respectively.

作者李晓洪宇窦祖俊徐旻涵陆煜翔周国栋 LI Xiao;HONG Yu;DOU Zujun;XU Minhan;LU Yuxiang;ZHOU Guodong(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2022年第11期38-49,共12页 Journal of Chinese Information Processing

基金科技部重大专项课题(2020YFB1313601) 国家自然科学基金(61773276,62076174)。

关键词隐式篇章关系识别对比学习条件变分编码 implicit discourse relation recognition contrastive learning condition variational auto-encoder

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1朱珊珊,洪宇,丁思远,严为绒,姚建民,朱巧明.基于训练样本集扩展的隐式篇章关系分类[J].中文信息学报,2016,30(5):111-120. 被引量：3

二级参考文献1

1徐凡,朱巧明,周国栋.基于树核的隐式篇章关系识别[J].软件学报,2013,24(5):1022-1035. 被引量：15

共引文献2

1阮慧彬,孙雨,洪宇,吴成豪,李晓,周国栋.基于图卷积神经网络的隐式篇章关系识别[J].中文信息学报,2021,35(8):28-37.
2郑江龙,陈锦秀.基于混合树结构神经网络的隐式篇章关系识别[J].厦门大学学报（自然科学版）,2017,56(4):576-583.

同被引文献8

1贾宝林,尹世群,王宁朝.基于门控多层感知机的端到端实体关系联合抽取[J].中文信息学报,2023,37(3):143-151. 被引量：3
2冯永,张春平,强保华,张逸扬,尚家兴.GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型[J].计算机学报,2020,43(2):190-205. 被引量：8
3王先武,张挺,吉欣,杜奕.基于带梯度惩罚深度卷积生成对抗网络的页岩三维数字岩心重构方法[J].计算机应用,2021,41(6):1805-1811. 被引量：2
4甘子发,昝红英,关同峰,李雯昕,张欢,朱田恬,穗志方,陈清财.CHIP 2020评测任务2概述:中文医学文本实体关系抽取[J].中文信息学报,2022,36(6):101-108. 被引量：5
5衡红军,苗菁.语义与句法信息加强的二元标记实体关系联合抽取[J].计算机工程,2023,49(4):77-84. 被引量：4
6廖涛,孙皓洁,张顺香.基于跨度和特征融合的实体关系联合抽取模型[J].计算机工程,2023,49(6):107-114. 被引量：3
7张仰森,刘帅康,刘洋,任乐,辛永辉.基于深度学习的实体关系联合抽取研究综述[J].电子学报,2023,51(4):1093-1116. 被引量：7
8高怡,纪焘,吴苑斌,牟小峰,王椗.基于标签增强和对比学习的鲁棒小样本事件检测[J].中文信息学报,2023,37(4):98-108. 被引量：3

引证文献1

1张强,曾俊玮,陈锐.基于对比学习与梯度惩罚的实体关系联合抽取模型[J].吉林大学学报（理学版）,2024,62(5):1155-1162.

1窦祖俊,洪宇,李晓,周国栋.基于注意力掩码语言模型的隐式篇章关系识别[J].中文信息学报,2022,36(10):17-26. 被引量：1
2孙鑫,周捷,俞志超,周学平.基于“异类相制”理论探讨周学平应用雷公藤治疗风湿免疫病的临床经验[J].中华中医药杂志,2022,37(11):6546-6549. 被引量：3
3付志涛.基于结构信息的异源遥感图像局部特征描述符研究[J].测绘学报,2022,51(12):2557-2557.
4倪伟,齐建玲,樊河雲.V_(2)O_(5)纳米纤维布的制备及其在电化学储能领域的研究进展[J].钢铁钒钛,2022,43(5):65-74.
5温伯陵.“犟骡子”左宗棠[J].领导文萃,2022(1):71-75.
6宋星月.弱约束条件下多特征融合的手背静脉识别关键算法研究[J].科技创新与生产力,2022(12):137-141.
7吴琳,许茹玉,粟兴旺,黄金玻,王晓明.基于结构误差的图卷积网络[J].计算机应用研究,2023,40(1):155-159.
8兰洪涛,童洲杰,马瑛,王志浩.不确定潜能的克隆性造血与衰老[J].中华老年医学杂志,2022,41(12):1530-1534. 被引量：2
9李凡超(综述),张飞(审校),彭吾训(审校).糖皮质激素诱导微血管内皮细胞损伤及凋亡与股骨头坏死的关系[J].重庆医学,2023,52(2):270-276. 被引量：6
10董彤,孔亮,郑颖人.土的应力方向依赖性(Ⅰ):概念与现象[J].地下空间与工程学报,2022,18(5):1452-1464. 被引量：5

<12 >

中文信息学报

2022年第11期

基于高困惑样本对比学习的隐式篇章关系识别被引量：1

参考文献1

二级参考文献1

共引文献2

同被引文献8

引证文献1

相关作者

相关机构

相关主题

基于高困惑样本对比学习的隐式篇章关系识别 被引量：1

参考文献1

二级参考文献1

共引文献2

同被引文献8

引证文献1

相关作者

相关机构

相关主题

微信扫一扫：分享

基于高困惑样本对比学习的隐式篇章关系识别被引量：1