基于核心句的端到端事件共指消解

End-to-End Event Coreference Resolution Based on Core Sentence

下载PDF

导出

摘要大多数先前的事件共指消解模型都属于成对相似度模型,通过编码两个事件提及的表示并计算相似度来判断是否共指。但是,当两个事件提及在文档内出现的位置接近时,编码其中一个事件提及的上下文表示会引入另一事件的信息,从而降低模型的性能。针对此问题,提出了一种基于核心句的端到端事件共指消解模型(End-to-end Event Coreference Resolution Based on Core Sentence,ECR-CS),该模型自动抽取事件信息并按照预先设置好的模板为每个事件提及构造核心句,利用核心句的表示代替事件提及的表示。由于核心句中只包含单个事件的信息,因此所提模型可以在编码事件表示时消除其他事件信息的干扰。此外,受到事件信息抽取工具的性能限制,构造的核心句可能会丢失事件的部分重要信息,提出利用事件在文档中的上下文表示来进行出弥补。所提模型引入了一种门控机制,将上下文嵌入向量分解为分别与核心句嵌入向量平行和正交的两个分量,平行分量可以认为是与核心句信息维度相同的信息,正交分量则是核心句中不包含的新信息。通过上下文信息和核心句信息的相关度,控制正交分量中被用来补充核心句中缺失的重要信息的新信息的量。在ACE2005数据集上进行实验,结果表明,相比最先进的模型,ECR-CS的CoNLL和AVG分数分别提升了1.76和1.04。 Most previous event coreference resolution models belong to pairwise similarity models,which judge whether the two events are coreferences by calculating the similarity between them.However,when two event mentions appear close to each other in the document,encoding one event contextual representation will introduce information from the other event,which degrades the performance of the model.To solve the problem,an end-to-end event coreference resolution method based on core sentence(ECR-CS)is proposed.The model automatically extracts event information and constructs a core sentence for each event mention according to the preset template,and uses the core sentence representation instead of the event representation.Since the core sentence contains only the information of a single event,the model can eliminate the interference of other event information when encoding the event representation.In addition,limited by the performance of event extraction,the core sentence may lose some important information of the event.The contextual representation of the event in the document is used to make up for this problem.To supplement the missing important information in the core sentence with the contextual information,a gated mechanism is introduced to filter the noise in the contextual representation.Experiments on dataset ACE2005 show that the CoNLL and AVG scores of ECR-CS improves by 1.76 and 1.04,respectively,compared with the state-of-the-art baseline model.

作者环志刚蒋国权张玉健刘浏丁鲲 HUAN Zhigang;JIANG Guoquan;ZHANG Yujian;LIU Liu;DING Kun(The Sixty-third Research Institute,National University of Defense Technology,Nanjing 210007,China;School of Cyber Science and Engineering,Southeast University,Nanjing 211189,China;School of Information Engineering,Suqian University,Suqian,Jiangsu 223800,China)

机构地区国防科技大学第六十三研究所东南大学网络空间安全学院宿迁学院信息工程学院

出处《计算机科学》 CSCD 北大核心 2023年第11期185-191,共7页 Computer Science

基金中国博士后科学基金面上资助(2021MD703983) 国防科技大学校科研计划项目(ZK20-46)。

关键词事件共指消解门控机制神经网络预训练语言模型事件核心句 Event coreference resolution Gated mechanism Neural network Pre-trained language models Event core sentence

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1程良,郜洪奎,王红斌.基于依存树与规则相结合的汉泰新闻事件要素抽取方法[J].软件导刊,2018,17(7):49-56. 被引量：8

二级参考文献10

1周国光.汉语配价语法论略[J].南京师大学报（社会科学版）,1994(4):103-106. 被引量：30
2赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
3邓丽娜,厉芹.泰语与汉语的同异性与对泰汉语教学[J].成都大学学报（教育科学版）,2008,22(4):64-67. 被引量：10
4付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19
5付剑锋,刘宗田,刘炜,单建芳.基于特征加权的事件要素识别[J].计算机科学,2010,37(3):239-241. 被引量：9
6丁效,宋凡,秦兵,刘挺.音乐领域典型事件抽取方法研究[J].中文信息学报,2011,25(2):15-20. 被引量：24
7梁源灵.中泰经贸关系的回顾与展望[J].东南亚纵横,2000(S2):9-15. 被引量：6
8张金花.汉泰语对比浅析[J].群文天地（下半月）,2012(2):98-98. 被引量：2
9孙汉萍.汉、泰语的同异性比较[J].湘潭师范学院学报（社会科学版）,1995,16(2):34-39. 被引量：15
10张凌,冯欣.基于词性模板与依存分析的中文微博情感要素抽取[J].计算机科学,2015,42(S1):474-478. 被引量：5

共引文献7

1程昊熠,李培峰,朱巧明.基于注意力机制的事件同指消解方法[J].计算机科学,2019,46(9):201-205. 被引量：1
2宦敏,程昊熠,李培峰.基于结构化表示的中文事件同指消解方法[J].中文信息学报,2019,33(12):19-27. 被引量：4
3崔斌,邹蕾,徐明月.基于BERT的诉讼案件违法事实要素自动抽取[J].科学技术与工程,2021,21(9):3669-3675. 被引量：4
4程昊熠,李培峰,朱巧明.基于跨语言数据增强的事件同指消解方法[J].中文信息学报,2022,36(3):19-26. 被引量：1
5环志刚,蒋国权,张玉健,刘浏,刘姗姗.门控机制融合多种特征的中文事件共指消解[J].计算机科学,2023,50(3):291-297. 被引量：1
6环志刚,蒋国权,周泽云,陈涛,严浩.基于事件共指消解的多源情报融合方法[J].计算机工程与设计,2023,44(10):3124-3131.
7于海英,张昊洋,刘兴丽.融合预训练模型的中文事件抽取方法[J].黑龙江科技大学学报,2023,33(5):753-758.

1环志刚,蒋国权,周泽云,陈涛,严浩.基于事件共指消解的多源情报融合方法[J].计算机工程与设计,2023,44(10):3124-3131.
2邓清林.2022年高考平面向量问题聚焦[J].中学生数理化（高一使用）,2023(2):32-33.
3姚锦晗,常水苗,张亚琴,王晓刚.不同眼轴长度下新型扫频生物测量仪ANTERION与IOLMaster 700测量数据的一致性[J].中华眼视光学与视觉科学杂志,2023,25(6):413-419. 被引量：1
4侍小青,耿华,刘双.基于幅值和梯度约束的磁化向量反演方法[J].地质论评,2023,69(S01):399-400. 被引量：1
5夏正新,苏翀,刘勇.基于上下文共指实体依赖的文档级关系抽取[J].数据采集与处理,2023,38(5):1226-1234.
6左彦飞,李进,梁吉鹏,王鹏辉,洪良友.盘结构行波共振非接触式激励方法与试验验证[J].推进技术,2022,43(12):291-302. 被引量：1
7韩慧妍,王文俊,韩燮,况立群,薛红新.融合语义实例重建的抓取位姿估计方法[J].计算机工程与科学,2023,45(10):1822-1829.
8何丽,杨美华,刘璐瑶.融合SPO语义和句法信息的事件检测方法[J].数据分析与知识发现,2023,7(9):114-124.
9赵卫东,周大昌.基于A^(*)与三阶贝塞尔曲线的融合改进路径规划算法[J].安徽工业大学学报（自然科学版）,2023,40(3):333-338. 被引量：1
10雒向东,余亮,李永宁.平面波在异向介质界面反射与折射条件研究[J].宁夏师范学院学报,2023,44(7):17-23. 被引量：1

计算机科学

2023年第11期

浏览历史

内容加载中请稍等...

基于核心句的端到端事件共指消解

参考文献1

二级参考文献10

共引文献7

相关作者

相关机构

相关主题

浏览历史