面向事件抽取的深度与主动联合学习方法被引量：6

Combining Deep Learning and Active Learning for Event Extraction

下载PDF

导出

摘要事件抽取旨在从非结构化的文本中抽取出事件的信息,并以结构化的形式予以呈现。监督学习作为基础的事件抽取方法往往受制于训练语料规模小、类别分布不平衡和质量参差不齐的问题。同时,传统基于特征工程的事件抽取方法往往会产生错误传递的问题,且特征工程较为复杂。为此,该文提出了一种联合深度学习和主动学习的事件抽取方法。该方法将RNN模型对触发词分类的置信度融入在主动学习的查询函数中,以此在主动学习过程中提高语料标注效率,进而提高实验的最终性能。实验结果显示,这一联合学习方法能够辅助事件抽取性能的提升,但也显示,联合模式仍有较高的提升空间,有待进一步思考和探索。 Event extraction aims at extracting event information from raw texts and representing them as a structured text. As a basic event extraction method,supervised learning often suffers from small scale,imbalanced distribution and uneven quality of training corpus. Moreover, traditional event extraction methods based on feature engineering are complicated and will always cause error propagation. To address these issues,this paper presents a method to combine deep learning and active learning by the confidence of the query function based on RNN＇s trigger classifica- tion, in order to improve the quality and efficiency of corpus annotation as well as the ultimate performance. The ex- perimental results show that this joint learning method can improve the event extraction, with substantial room for further exploration.

作者邱盈盈洪宇周文瑄姚建民朱巧明 QIU Yingying;HONG Yu;ZHOU Wenxuan;YAO Jianmin;ZHU Qiaoming(Provincial Key Laboratory of Computer Information Processing Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学江苏省计算机信息处理重点实验室

出处《中文信息学报》 CSCD 北大核心 2018年第6期98-106,共9页 Journal of Chinese Information Processing

基金国家自然科学基金(61373097 61672367 61672368) 江苏省科技计划(BK20151222) 教育部-中国移动基金(MCM20150602)

关键词事件抽取深度学习主动学习循环神经网络 event extraction deep learning active learning RNN

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1肖升,何炎祥.事件超图模型及类型识别[J].中文信息学报,2013,27(1):30-38. 被引量：2
2徐霞,李培峰,朱巧明.一个半监督的中文事件抽取方法[J].中文信息学报,2016,30(2):168-174. 被引量：4

二级参考文献28

1李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
2周昭涛,卜东波,程学旗.文本的图表示初探[J].中文信息学报,2005,19(2):36-43. 被引量：17
3袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
4刘群,李素建.基于《知网》的词汇语义相似度计算[J].计算语言学及中文信息处理,2002,7:59-76.
5Linguistic Data Consortium. ACE(Automatic Content Extraction) Chinese Annotation Guidelines for Events[OL].http://www.ldc.upenn.edu/Projects/ACE/,2005.
6Zhou Dengyong,Huang Jiayuan,Bernhard Scholkopf. Learning with Hypergraphs:Clustering,Classification,and Embedding[A].Vancouver/Whistler,Canada:IEEE,2006.1601-1608.
7C Berge. Graph and Hypergraph[M].Amsterdam:North-Holland Publishing Company,1973.
8G Gallo,G Longo,S Nguyen. Directed hypergraph and applications[J].Discrete Applied Mathematics,1993.177-201.
9Chen F,Farahat A,Brants T. Multiple Similarity Measures and Source-pair Information in Story Link Detection[A].Boston,MA,USA:Association for ComputationalLinguistics,2004.313-320.
10Roman Yangarber, Ralph Grishman, Pasi Tapanain- en, Silja Huttunen. Unsupervised discovery of scenar- io-level patterns for Information Extraction[-C]//Pro- ceedings of the 6th Conference on Applied Natural Language Processing. 2000: 282-289.

共引文献4

1肖升,李勇帆,何炎祥.基于依存分析的离合触发词合法分离形式判定[J].计算机工程与应用,2014,50(10):11-17.
2刘思尧,施科峰.基于元搜索的事件发现与关联算法[J].内蒙古师范大学学报（自然科学汉文版）,2017,46(4):555-559.
3盛煜堃,彭艳兵.基于注意力机制BiLSTM的事件抽取方法[J].电子设计工程,2020,28(8):170-173. 被引量：12
4黄细凤.基于动态掩蔽注意力机制的事件抽取[J].计算机应用研究,2020,37(7):1964-1968. 被引量：7

同被引文献53

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2姜吉发.一种事件信息抽取模式获取方法[J].计算机工程,2005,31(15):96-98. 被引量：27
3冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):104-110. 被引量：24
4郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,23(5):47-52. 被引量：37
5吴家皋,周凡坤,张雪英.HMM模型和句法分析相结合的事件属性信息抽取[J].南京师大学报（自然科学版）,2014,37(1):30-34. 被引量：10
6周练.Word2vec的工作原理及应用探究[J].科技情报开发与经济,2015,28(2):145-148. 被引量：101
7张贺,刘茂福,胡慧君,顾进广.基于信息单元融合的新闻原子事件抽取[J].武汉大学学报（理学版）,2015,61(2):139-144. 被引量：4
8李井竹,陆玉婷,顾进广.基于句法分析的临床指南事件及事件关系提取[J].武汉大学学报（理学版）,2015,61(2):156-162. 被引量：2
9吴斐,张玉红,胡学钢.面向评论信息的跨领域词汇情感倾向判别方法[J].计算机科学,2015,42(6):220-222. 被引量：2
10范玉玲,顾进广,黄智生.中文医学指南的事件处理及其语义数据自动生成[J].中国数字医学,2015,10(9):76-78. 被引量：2

引证文献6

1安明慧,沈忱林,李寿山,李逸薇.基于联合学习的问答情感分类方法[J].中文信息学报,2019,33(10):119-126. 被引量：2
2余辉,徐畅,刘雅茹,付玉伟,高东平.基于BiLSTM-CRF的中文临床指南治疗事件抽取[J].中华医学图书情报杂志,2020,29(2):9-14. 被引量：6
3曹高辉,任卫强,丁恒.面向限定域的深度语义事件泛化研究[J].情报学报,2020,39(8):863-871. 被引量：3
4余传明,林虹君,张贞港.基于多任务深度学习的实体和事件联合抽取模型[J].数据分析与知识发现,2022,6(2):117-128. 被引量：9
5冯琳慧,乔林波,阚志刚.面向事件检测的预训练主动学习模型[J].南京师范大学学报（工程技术版）,2022,22(2):41-47. 被引量：1
6成全,张双宝.基于深度学习的特征增强式安全事故文本实体识别模型研究[J].中国安全生产科学技术,2024,20(6):58-66.

二级引证文献20

1赵鹏飞,李艳玲,林民.面向迁移学习的意图识别研究进展[J].计算机科学与探索,2020,14(8):1261-1274. 被引量：7
2冯钧,王云峰,邬炜,朱跃龙.城市内涝事理图谱构建方法及应用[J].河海大学学报（自然科学版）,2020,48(6):479-487. 被引量：23
3廖美红.基于联合学习的问答情感分析技术研究[J].电脑编程技巧与维护,2021(7):33-35.
4屈倩倩,阚红星.基于Bert-BiLSTM-CRF的中医文本命名实体识别[J].电子设计工程,2021,29(19):40-43. 被引量：23
5张曦月,胡瑾秋,张来斌,董绍华,徐康凯.基于CW-AGNES的油气储运企业事故风险因素文本泛化方法[J].油气储运,2021,40(11):1242-1249. 被引量：3
6闫文浩.国内外事件抽取技术应用研究分析[J].科学与信息化,2022(20):85-87.
7刘航冶,富铁楠,杨勇.互联网开源文本情报智能分析技术综述[J].情报杂志,2023,42(2):12-16. 被引量：2
8潘俊,李萌配,王贤明.应用深度学习的中文命名实体识别研究综述[J].数字图书馆论坛,2023,19(5):1-9. 被引量：2
9张诗莹,李阳.融合事理知识图谱与网络舆情分析的突发事件情报支持路径及实证研究——以危化品事故为例[J].信息资源管理学报,2023,13(4):60-71. 被引量：1
10陈诺,李旭晖.一种基于模板提示学习的事件抽取方法[J].数据分析与知识发现,2023,7(6):86-98. 被引量：4

1刘爽英,朱勇华.针对社交网络边权重的差分隐私保护[J].计算机工程与设计,2018,39(1):44-48. 被引量：3
2洪青霞.打造优质课堂,发展数学智慧——浅析小学数学优质课堂的构建[J].数学大世界（上旬）,2017,0(10):41-41.
3刘金华.兴趣教学方法探究[J].文学教育,2018,0(12):173-173. 被引量：1
4张萃,朱航,黄海东.机电类本科毕业设计“教师联合”培养模式[J].设备管理与维修,2018(10):55-56. 被引量：2
5杨帅,康旭琴,安新颖,范少萍,张音,王磊.肝癌领域精准医学语料标注研究[J].军事医学,2018,42(2):92-96. 被引量：2
6李枫林,柯佳.基于深度学习框架的实体关系抽取研究进展[J].情报科学,2018,36(3):169-176. 被引量：27
7骆建红.深度学习在建构区中绽放[J].读与写（上旬）,2018(1):278-279.
8雷新华.Excel中vlookup函数的应用方法及实例解析[J].科技视界,2017(18):127-127.
9胡鸿志,岑德炼,吴汝琴,滕全进.基于小波包和BAGRNN的模拟电路故障诊断方法[J].微电子学与计算机,2018,35(4):42-45. 被引量：7
10冯思齐,吕钢.利用RNN模型生成中国古典诗歌[J].通讯世界,2018,25(2):361-363. 被引量：1

中文信息学报

2018年第6期

浏览历史

内容加载中请稍等...

面向事件抽取的深度与主动联合学习方法被引量：6

参考文献2

二级参考文献28

共引文献4

同被引文献53

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

面向事件抽取的深度与主动联合学习方法 被引量：6

参考文献2

二级参考文献28

共引文献4

同被引文献53

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

面向事件抽取的深度与主动联合学习方法被引量：6