文档级无触发词事件抽取联合模型被引量：7

Joint Model for Document-Level Event Extraction Without Triggers

下载PDF

导出

摘要当前广为研究的在单个句子范围内的事件抽取方法,难以扩展到从分布在一篇文章里的多个句子中抽取同一事件的完整论元。对此,提出了一种基于深度学习的文档级事件抽取联合模型。首先,利用基于多头自注意力机制的实体识别模块逐句识别文档中的实体并输出其类型。然后,通过定义不同论元角色对事件类型的重要度训练事件类型检测模块,实现在无触发词条件下定位事件表述中心句并判断事件类型。最后,事件论元抽取模块通过在实体语义向量中嵌入实体的类型信息和实体到事件中心句的距离信息,并输入Transformer网络与上下文交换信息,实现在文档范围内抽取全部事件论元。通过对上述三个子模块进行联合训练,进一步实现了端到端的事件抽取,避免了管道式方法的误差传递。在公开数据集上的实验结果表明:在单事件条件下,该模型取得了86.3%的F1值,优于当前最佳的文档级事件抽取方法,并且具有优秀的模型训练速度。 The widely researched sentence-level event extraction methods struggle to extract all arguments of the same event from a whole document. To solve this problem, this paper proposes a joint model for document-level event extraction based on deep learning. Firstly, an entity recognition module based on multi-head self-attention mechanism is used to identify entities and their types sentence by sentence. Then, an event type detection module trained by defining the importance of different argument roles, is used to locate the event mention sentence and predict the event type without the help of event triggers. Finally, an event argument extraction module embeds every entity’s semantic vector with its type information and its distance to the event mention sentence before feeding into a context-aware Transformer, in order to extract arguments within the document scope. In addition, by training the three modules mentioned above jointly, this paper realizes an end-to-end event extraction model and avoids error propagation problems in traditional pipeline models. The experimental results on a public dataset shows that, when each document contains only one event, the proposed model achieves a 86.3% F1-score, which outperforms stateof-the-art methods, and the training process completes rather quickly.

作者王雷李瑞轩李玉华辜希武杨琪 WANG Lei;LI Ruixuan;LI Yuhua;GU Xiwu;YANG Qi(School of Computer Science and Technology,Huazhong University of Science and Technology,Wuhan 430074,China)

机构地区华中科技大学计算机科学与技术学院

出处《计算机科学与探索》 CSCD 北大核心 2021年第12期2327-2334,共8页 Journal of Frontiers of Computer Science and Technology

基金国家重点研发计划(2016QY01W0202,2016YFB0800402) 国家自然科学基金(U1836204,U1936108,61572221,61433006,U1401258,61572222,61502185) 国家社会科学基金(16ZDA092)。

关键词文档级事件抽取无触发词联合模型实体识别事件检测 document-level event extraction triggers free joint model entity recognition event detection

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1仲伟峰,杨航,陈玉博,刘康,赵军.基于联合标注和全局推理的篇章级事件抽取[J].中文信息学报,2019,33(9):88-95. 被引量：20
2赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：105

二级参考文献9

1Naomi Daniel,Dragomir Radev and Timothy Allison.Sub-event based Multi-document Summarization[A].In:Proceedings of the HLT-NAACL Workshop on Text Summarization[C].2003.9-16.
2Elena Filatova and Vasileios Hatzivassiloglou.Event-based Extractive summarization[A].In:Proceedings of ACL Workshop on Summarization[C]].2004.104-111.
3Wenjie Li,Mingli Wu and Qin Lu.Extractive Summarization using Inter-and Intra-Event Relevance[A].In:Proceedings of the 44th Annual Meeting of the Association for Computational Liguistics[C].2006.369-376.
4David Ahn.The stages of event extraction[A].In:Proceedings of the Workshop on Annotations and Reasoning about Time and Events[C].2006.1-8.
5ACE (Automatic Content Extraction) Chinese Annotation Guidelines for Events.National Institute of Standards and Technology[R].2005.
6Mihai Surdeanu,Sanda Harabagiu,John Williams,et al.Using Predicate-Argument Structures for Information Extraction[A].In:Proceedings of ACL[C].2003.8-15.
7Mihai Surdeanu and Sanda Harabagiu.Infrastructure for Open-Domain Information Extraction[A].In:Proceedings of the Human Language Technology Conference[C].2002.325-330.
8Hai Leong Chieu,Hwee Tou Ng.A Maximum Entropy Approach to Information Extraction from SemiStructured and Free Text[A].In:Proceedings of the 18th National Conference on Artificial Intelligence[C].2002.786-791.
9来自ACE标准标注结果,分别对应着ACE的三项标注任务:实体识别、时间表达式识别和属性词识别.

共引文献121

1许荣华,吴刚,李培峰,朱巧明.基于指代消解的中文事件融合方法[J].计算机应用,2009,29(8):2264-2267. 被引量：3
2付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19
3仲兆满,刘宗田,周文,付剑锋.事件关系表示模型[J].中文信息学报,2009,23(6):56-60. 被引量：23
4许荣华,吴刚,李培峰,朱巧明.基于事件框架的主题事件融合研究[J].计算机应用研究,2009,26(12):4542-4545. 被引量：6
5张先飞,郭志刚,刘嵩,程磊,田雨暄.基于触发词指导的自相似度聚类事件检测[J].计算机科学,2010,37(3):212-214. 被引量：12
6付剑锋,刘宗田,刘炜,单建芳.基于特征加权的事件要素识别[J].计算机科学,2010,37(3):239-241. 被引量：9
7许君宁,董萍,刘怀亮.基于知网的中文事件抽取研究[J].情报杂志,2009,28(B12):150-151. 被引量：2
8吴刚,许荣华,朱巧明,李培峰,钱培德.一种基于角色匹配的事件抽取方法[J].微计算机信息,2010,26(9):187-189. 被引量：3
9石振国,刘宗田,王杰华,冯达盛.事件网络模型与应用研究[J].南通大学学报（自然科学版）,2010,9(3):55-65.
10刘小明,樊孝忠,刘里.融合事件信息的复杂问句分析方法[J].华南理工大学学报（自然科学版）,2011,39(7):140-145. 被引量：7

同被引文献28

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：105
2高强,游宏梁.事件抽取技术研究综述[J].情报理论与实践,2013,36(4):114-117. 被引量：30
3郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：84
4朱木易洁,鲍秉坤,徐常胜.知识图谱发展与构建的研究进展[J].南京信息工程大学学报（自然科学版）,2017,9(6):575-582. 被引量：46
5马晨曦,陈兴蜀,王文贤,王海舟.基于递归神经网络的中文事件检测[J].信息网络安全,2018(5):75-81. 被引量：9
6秦彦霞,张民,郑德权.神经网络事件抽取技术综述[J].智能计算机与应用,2018,8(3):1-5. 被引量：17
7Xiaocheng FENG,Bing QIN,Ting LIU.A language-independent neural network for event detection[J].Science China(Information Sciences),2018,61(9):75-86. 被引量：55
8王凯,洪宇,邱盈盈,姚建民,周国栋.融合上下文依赖和句子语义的事件线索检测研究[J].计算机科学与探索,2018,12(3):423-431. 被引量：3
9贺瑞芳,段绍杨.基于多任务学习的中文事件抽取联合模型[J].软件学报,2019,30(4):1015-1030. 被引量：43
10吴文涛,李培峰,朱巧明.基于混合神经网络的实体和事件联合抽取方法[J].中文信息学报,2019,33(8):77-83. 被引量：19

引证文献7

1杨登辉,刘靖.基于RBBLC模型的中文事件抽取方法[J].南京师范大学学报（工程技术版）,2022,22(3):38-44. 被引量：1
2焦磊,云静,刘利民,郑博飞,袁静姝.封闭域深度学习事件抽取方法研究综述[J].计算机科学与探索,2023,17(3):533-548. 被引量：2
3胡婕,何巍,曾张帆.基于RoBERTa的全局图神经网络文档级中文金融事件抽取[J].中文信息学报,2023,37(2):107-118. 被引量：3
4高兵,皇甫楠,邹启杰,秦静.基于全局语义匹配的篇章级事件抽取方法[J].计算机技术与发展,2023,33(7):154-159. 被引量：1
5梁冬,张程,史骁,谭文婷,吕存驰,赵晓芳.基于对比学习增强句子语义的事件检测方法[J].高技术通讯,2023,33(7):669-682.
6王人玉,项威,王邦,代璐.文档级事件抽取研究综述[J].中文信息学报,2023,37(6):1-14. 被引量：1
7纪婉婷,马宇航,鲁闻一,王俊陆,宋宝燕.文档级事件抽取反向推理模型[J].计算机工程与应用,2024,60(5):122-129.

二级引证文献7

1陈彦杰,廖涛.基于图注意力网络的突发事件触发词抽取[J].现代计算机,2023,29(11):33-37.
2林玩聪,韩明杰,靳婷.基于数据增强的多层次论点立场分类方法[J].广西师范大学学报（自然科学版）,2023,41(6):62-69.
3马亚美,王双亭,都伟冰.双分支多维注意特征融合的高光谱图像分类[J].计算机工程与应用,2024,60(7):192-203.
4马宇航,宋宝燕,丁琳琳,鲁闻一,纪婉婷.融合实体信息和时序特征的问答式事件检测方法[J].计算机工程与设计,2024,45(4):1218-1224.
5薛继伟,胡馨元,薛鹏杰.基于提示学习的篇章级事件论元抽取方法研究[J].计算机技术与发展,2024,34(6):125-131.
6薛颂东,李永豪,赵红燕.基于多粒度阅读器和图注意力网络的文档级事件抽取[J].计算机应用研究,2024,41(8):2329-2335.
7王嘉宾,罗俊仁,周棪忠,王超,张万鹏.事件抽取方法综述:深度学习与预训练对比分析[J].计算机科学,2024,51(9):196-206.

1汪翠,张亚飞,郭军军,高盛祥,余正涛.融合句法信息的无触发词事件检测方法[J].计算机应用,2021,41(12):3534-3539.
2李彭伟,李亚钊.面向事件画像的事理图谱构建方法[J].指挥信息系统与技术,2021,12(5):54-60. 被引量：4
3曹江,高喆,吴玲,雷大军,李亚兰.基于密集特征融合的超分辨率算法研究[J].信息技术与信息化,2021(10):72-74.
4王亮,肖易寒.Transformer网络在雷达辐射源识别中的应用[J].应用科技,2021,48(5):81-85. 被引量：4
5唐超,李庶林,周梦婧,刘胤池.基于微震监测的应力场反演方法及其工程应用研究[J].岩土工程学报,2021,43(9):1730-1738. 被引量：5
6Li Juan,Yu Bing-Song,Tian Yu-Kun,Kang Hai-Xia,Wang Yu-Fang,Zhou Hui.Effect analysis of borehole microseismic monitoring technology on shale gas fracturing in western Hubei[J].Applied Geophysics,2020,17(5):764-775. 被引量：2
7杨欢,任珏.怎样开展高中英语“读后续写”教学[J].语数外学习（高中版）（上）,2021(7):75-76.
8石锓,王秀云.“一X就Y”的构式化与构式裂变[J].语言科学,2021,20(6):623-644. 被引量：10
9李洁.《夏天里的成长》教学设计[J].小学语文教学,2021(19):125-127.
10蔡爱佳.品味教材智慧教学[J].中学政治教学参考,2021(42):18-19.

计算机科学与探索

2021年第12期

浏览历史

内容加载中请稍等...

文档级无触发词事件抽取联合模型被引量：7

参考文献2

二级参考文献9

共引文献121

同被引文献28

引证文献7

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

文档级无触发词事件抽取联合模型 被引量：7

参考文献2

二级参考文献9

共引文献121

同被引文献28

引证文献7

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

文档级无触发词事件抽取联合模型被引量：7