一种基于模板提示学习的事件抽取方法被引量：4

An Event Extraction Method Based on Template Prompt Learning

导出

摘要【目的】针对现有基于标注和基于文本生成的事件抽取模型存在的不足,提出一种使用自动构造模板引出预训练语言模型知识的事件联合抽取模型。【方法】基于事件提示符设计模板自动构造策略以生成统一的提示模板,在编码层为事件提示符引入事件提示编码层,而后接入预训练的BART模型捕捉句子的语义信息,并生成对应的预测序列,从预测序列中提取对应事件类型的触发词和论元,实现事件触发词和论元的联合抽取。【结果】在包含复杂事件信息文本的事件数据集中,事件触发词抽取和事件论元抽取的F1值分别达到77.67%和65.06%,相较于最优的基准方法分别提升了2.43和1.62个百分点。【局限】模型仅局限于句子级文本,且仅在编码层对提示符进行调优。【结论】本文模型基于提示符调优,能够在减少模板构建成本的同时保持相同甚至更优的性能,并且能够识别具有复杂事件信息的文本,有效提升了事件元素多标签分类的效果。 [Objective]This study proposes a joint event extraction model employing an automatically constructed template to leverage the knowledge of pre-trained language models,aiming to improve the existing event extraction models relying on sequence labeling and text generation.[Methods]Firstly,we designed an automatic template construction strategy based on the Event Prompt to generate unified prompt templates.Then,we introduced the Event Prompt Embedding layer for the Event Prompt at the encoding level.Next,we used the BART model to capture the semantic information of the sentence and generated the corresponding prediction sequence.Finally,we jointly extracted trigger words and event arguments from the prediction sequences.[Results]In a dataset containing complex event information,the F1 values for event trigger and argument extraction reached 77.67%and 65.06%,which were 2.43%and 1.62%higher than the optimal baseline method.[Limitations]The proposed model could only work with sentence-level texts and optimize the Event Prompt at the encoding layer.[Conclusions]The proposed model can reduce the template construction cost while maintaining the same or even better performance.The model could recognize text with complex event information and improve the multi-label classification for event elements.

作者陈诺李旭晖 Chen Nuo;Li Xuhui(School of Information Management,Wuhan University,Wuhan 430072,China;Big Data Institute,Wuhan University,Wuhan 430072,China)

机构地区武汉大学信息管理学院武汉大学大数据研究院

出处《数据分析与知识发现》 CSCD 北大核心 2023年第6期86-98,共13页 Data Analysis and Knowledge Discovery

基金国家自然科学基金重大研究计划(项目编号:91646206) 国家社会科学基金重大项目(项目编号:21&ZD334)的研究成果之一。

关键词中文事件抽取预训练语言模型提示学习联合学习 Chinese Event Extraction Pre-trained Language Model Prompt Learning Joint Learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] G202 [文化科学—传播学]

引文网络
相关文献

参考文献7

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
2贾阵,丁泽华,陈艳平,黄瑞章,秦永彬.面向司法数据的事件抽取方法研究[J].计算机工程与应用,2023,59(6):277-282. 被引量：4
3陈星月,倪丽萍,倪志伟.基于ELECTRA模型与词性特征的金融事件抽取方法研究[J].数据分析与知识发现,2021,5(7):36-47. 被引量：7
4高甦,陶浒,蒋彦钊,贾麒,张德政,谢永红.中医文献的句子级联合事件抽取[J].情报工程,2021,7(5):15-29. 被引量：5
5余传明,林虹君,张贞港.基于多任务深度学习的实体和事件联合抽取模型[J].数据分析与知识发现,2022,6(2):117-128. 被引量：9
6刘泽旖,余文华,洪智勇,柯冠舟,谭荣杰.基于问题回答模式的中文事件抽取[J].计算机工程与应用,2023,59(2):153-160. 被引量：1
7李旭晖,程威,唐小雅,于滔,陈壮,钱铁云.基于多层卷积神经网络的金融事件联合抽取方法[J].图书情报工作,2021,65(24):89-99. 被引量：15

二级参考文献42

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
3Naomi Daniel,Dragomir Radev and Timothy Allison.Sub-event based Multi-document Summarization[A].In:Proceedings of the HLT-NAACL Workshop on Text Summarization[C].2003.9-16.
4Elena Filatova and Vasileios Hatzivassiloglou.Event-based Extractive summarization[A].In:Proceedings of ACL Workshop on Summarization[C]].2004.104-111.
5Wenjie Li,Mingli Wu and Qin Lu.Extractive Summarization using Inter-and Intra-Event Relevance[A].In:Proceedings of the 44th Annual Meeting of the Association for Computational Liguistics[C].2006.369-376.
6David Ahn.The stages of event extraction[A].In:Proceedings of the Workshop on Annotations and Reasoning about Time and Events[C].2006.1-8.
7ACE (Automatic Content Extraction) Chinese Annotation Guidelines for Events.National Institute of Standards and Technology[R].2005.
8Mihai Surdeanu,Sanda Harabagiu,John Williams,et al.Using Predicate-Argument Structures for Information Extraction[A].In:Proceedings of ACL[C].2003.8-15.
9Mihai Surdeanu and Sanda Harabagiu.Infrastructure for Open-Domain Information Extraction[A].In:Proceedings of the Human Language Technology Conference[C].2002.325-330.
10Hai Leong Chieu,Hwee Tou Ng.A Maximum Entropy Approach to Information Extraction from SemiStructured and Free Text[A].In:Proceedings of the 18th National Conference on Artificial Intelligence[C].2002.786-791.

共引文献139

1李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622.
2许荣华,吴刚,李培峰,朱巧明.基于指代消解的中文事件融合方法[J].计算机应用,2009,29(8):2264-2267. 被引量：3
3付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：19
4仲兆满,刘宗田,周文,付剑锋.事件关系表示模型[J].中文信息学报,2009,23(6):56-60. 被引量：23
5许荣华,吴刚,李培峰,朱巧明.基于事件框架的主题事件融合研究[J].计算机应用研究,2009,26(12):4542-4545. 被引量：6
6张先飞,郭志刚,刘嵩,程磊,田雨暄.基于触发词指导的自相似度聚类事件检测[J].计算机科学,2010,37(3):212-214. 被引量：12
7付剑锋,刘宗田,刘炜,单建芳.基于特征加权的事件要素识别[J].计算机科学,2010,37(3):239-241. 被引量：9
8许君宁,董萍,刘怀亮.基于知网的中文事件抽取研究[J].情报杂志,2009,28(B12):150-151. 被引量：2
9吴刚,许荣华,朱巧明,李培峰,钱培德.一种基于角色匹配的事件抽取方法[J].微计算机信息,2010,26(9):187-189. 被引量：3
10石振国,刘宗田,王杰华,冯达盛.事件网络模型与应用研究[J].南通大学学报（自然科学版）,2010,9(3):55-65.

同被引文献31

1张琳,秦策,叶文豪.基于条件随机场的法言法语实体自动识别模型研究[J].数据分析与知识发现,2017,1(11):46-52. 被引量：11
2赵琴,陈健,张月琴.基于逐次适应蚁群优化算法的个性化微学习推荐[J].计算机工程,2018,44(2):238-243. 被引量：6
3张仰森,郑佳,黄改娟,蒋玉茹.基于双重注意力模型的微博情感分析方法[J].清华大学学报（自然科学版）,2018,58(2):122-130. 被引量：49
4Xiaocheng FENG,Bing QIN,Ting LIU.A language-independent neural network for event detection[J].Science China(Information Sciences),2018,61(9):75-86. 被引量：56
5陈斌,周勇,刘兵.基于卷积双向长短期记忆网络的事件触发词抽取[J].计算机工程,2019,45(1):153-158. 被引量：19
6赵宏.疫情防控下个人的权利限缩与边界[J].比较法研究,2020,34(2):11-24. 被引量：82
7刘忠宝,秦权,赵文娟.微博环境下新冠肺炎疫情事件对网民情绪的影响分析[J].情报杂志,2021,40(2):138-145. 被引量：18
8周晓进,徐陈铭,阮彤.面向中文电子病历的多粒度医疗实体识别[J].计算机科学,2021,48(4):237-242. 被引量：10
9王婷,杨文忠.文本情感分析方法研究综述[J].计算机工程与应用,2021,57(12):11-24. 被引量：106
10钟佳娃,刘巍,王思丽,杨恒.文本情感分析方法及应用综述[J].数据分析与知识发现,2021,5(6):1-13. 被引量：82

引证文献4

1赖宇斌,陈燕,胡小春,黄欣.基于提示嵌入的突发公共卫生事件微博文本情感分析[J].数据分析与知识发现,2023,7(11):46-55. 被引量：4
2苏杭,胡亚豪,潘志松.利用提示调优融合多种信息的低资源事件抽取方法[J].计算机应用研究,2024,41(2):381-387.
3翟洁,李艳豪,李彬彬,郭卫斌.基于大语言模型的个性化实验报告评语自动生成与应用[J].计算机工程,2024,50(7):42-52.
4屈潇雅,李兵,温立强.面向行政执法案件文本的事件抽取研究[J].计算机工程,2024,50(9):63-71.

二级引证文献4

1佘硕,林雅玲.基于LDA主题模型的我国突发公共卫生事件应急管理主题热度与趋势分析[J].中国应急管理科学,2024(6):66-85.
2陈燕,赖宇斌,肖澳,廖宇翔,陈宁江.基于CLIP和交叉注意力的多模态情感分析模型[J].郑州大学学报（工学版）,2024,45(2):42-50.
3陆振昇.面向数字人民币用户体验的微博情感分析[J].科技和产业,2024,24(8):117-124. 被引量：1
4陈果,尹梓涵.信息资源管理视域下的健康信息学研究——国内外研究主题对比分析[J].现代情报,2024,44(8):137-152.

1顾明珠,明瑞成,邱创一,王新文.一种多教师模型知识蒸馏深度神经网络模型压缩算法[J].电子技术应用,2023,49(8):7-12.
2梁冬,张程,史骁,谭文婷,吕存驰,赵晓芳.基于对比学习增强句子语义的事件检测方法[J].高技术通讯,2023,33(7):669-682.
3唐家骏,张波涛.寒地中型公路客运站空间布局优化研究[J].低温建筑技术,2023,45(7):10-13.
4郭志敏,戴海曙,翟江,洪昊岑,王柏村,谢海波,杨华勇.基于FMI的轴向柱塞泵分布式联合仿真与动态优化[J].工程设计学报,2023,30(4):495-502. 被引量：3

数据分析与知识发现

2023年第6期

浏览历史

内容加载中请稍等...

一种基于模板提示学习的事件抽取方法被引量：4

参考文献7

二级参考文献42

共引文献139

同被引文献31

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于模板提示学习的事件抽取方法 被引量：4

参考文献7

二级参考文献42

共引文献139

同被引文献31

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于模板提示学习的事件抽取方法被引量：4