单步片段标注的实体关系联合抽取模型被引量：1

Joint Extraction of Entities and Relations Model for Single-Step Span-Labeling

下载PDF

导出

摘要关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系联合抽取模型(span-labeling based model,SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(token)序列进行组合排列重新平铺成片段(span)序列;使用LSTM和多头自注意力机制进行片段深层语义特征提取;设计了实体关系标签,使用多层标注方法进行关系标签分类。在英文数据集NYT、WebNLG上进行实验,相对于基线模型F1值显著提高,验证了模型的有效性,能有效解决上述问题。 As an upstream task in many fields such as knowledge graph,relation extraction has a wide range of application value and has received extensive attention in recent years.At present,the problem of exposure bias is common in relation extraction models,and the problems of entity nesting and entity overlapping are common in extracted text,which seriously affect the performance of the model.Therefore,this paper proposes an entity-relationship extraction model(span-labeling based model,SLM)based on Span labeling,which mainly includes:transforming entity-relation extraction problem into span labeling problem;the tokens are combined and arranged and re-tiled into a Span sequence.LSTM and multi-head self-attention mechanism are used to extract deep semantic features of the span.An entity relation label is designed,and a multi-layer labeling method is used for relation label classification.Experiments are carried out on the English datasets NYT and WebNLG.Compared with the baseline model,the F1 value is significantly improved,which verifies the effectiveness of the model,indicating that the model can effectively solve the above problems.

作者郑肇谦韩东辰赵辉 ZHENG Zhaoqian;HAN Dongchen;ZHAO Hui(School of Computer Science and Engineering,Changchun University of Technology,Changchun 130012,China)

机构地区长春工业大学计算机科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2023年第9期130-139,共10页 Computer Engineering and Applications

基金吉林省教育厅“十三五”科学技术项目(JJKH20200677KJ)。

关键词关系抽取联合抽取片段标注映射策略暴露偏差实体嵌套实体重叠 relation extraction joint extraction span-labeling mapping strategy exposure bias entity nesting entity overlap

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1赵敏钧,赵亚伟,赵雅捷,罗刚.一种新的基于深度学习的重叠关系联合抽取模型[J].中国科学院大学学报（中英文）,2022,39(2):240-251. 被引量：5
2吴天昊,古丽拉·阿东别克.基于神经元块级别注意力机制的LSTM关系抽取[J].计算机应用研究,2020,37(S02):76-79. 被引量：6
3冯钧,张涛,杭婷婷.重叠实体关系抽取综述[J].计算机工程与应用,2022,58(1):1-11. 被引量：12
4鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述[J].软件学报,2019,30(6):1793-1818. 被引量：165
5李冬梅,张扬,李东远,林丹琼.实体关系抽取方法研究综述[J].计算机研究与发展,2020,57(7):1424-1448. 被引量：84

二级参考文献44

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
2何婷婷,徐超,李晶,赵君喆.基于种子自扩展的命名实体关系抽取方法[J].计算机工程,2006,32(21):183-184. 被引量：25
3邓擘,樊孝忠,杨立公.用语义模式提取实体关系的方法[J].计算机工程,2007,33(10):212-214. 被引量：24
4刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：59
5徐健,张智雄,吴振新.实体关系抽取的技术方法综述[J].现代图书情报技术,2008(8):18-23. 被引量：54
6温春,石昭祥,辛元.基于扩展关联规则的中文非分类关系抽取[J].计算机工程,2009,35(24):63-65. 被引量：15
7黄晨,钱龙华,周国栋,朱巧明.基于卷积树核的无指导中文实体关系抽取研究[J].中文信息学报,2010,24(4):11-17. 被引量：12
8虞欢欢,钱龙华,周国栋,朱巧明.基于合一句法和实体语义树的中文语义关系抽取[J].中文信息学报,2010,24(5):17-23. 被引量：19
9陈宇,郑德权,赵铁军.基于Deep Belief Nets的中文名实体关系抽取[J].软件学报,2012,23(10):2572-2585. 被引量：70
10黄勋,游宏梁,于洋.关系抽取技术研究综述[J].现代图书情报技术,2013(11):30-39. 被引量：24

共引文献233

1曹艳琴.基于深度学习的英语自然语言处理系统[J].系统仿真技术,2021,17(4):285-288. 被引量：1
2葛世奇,孙新,寇桓锦,袁燕.基于预训练模型的政务领域实体关系抽取[J].情报工程,2022,8(4):3-13. 被引量：2
3周俊,郑彭元,袁立存,戈为溪,梁静.基于改进CASREL的水稻施肥知识图谱信息抽取研究[J].农业机械学报,2022,53(11):314-322. 被引量：9
4刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
5谢晓璇,鄂海红,匡泽民,谭玲,周庚显,罗浩然,李峻迪,宋美娜.高血压超关系知识图谱建模及用药决策推理实践[J].中文信息学报,2023,37(3):65-78.
6葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：5
7王大阜,王静,邓志文,贾志勇,张浴日.深度学习赋能网络安全知识图谱实体关系联合抽取研究[J].中国电子科学研究院学报,2023,18(5):420-428. 被引量：1
8刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
9杨延云,杜建强,聂斌,罗计根,贺佳.融合数据增强和注意力机制的中医实体及关系联合抽取[J].智能计算机与应用,2023,13(8):186-191.
10张婷婷,让冉,张龙波,邢林林,蔡红珍.面向新兴产业的检验检测服务关系抽取[J].智能计算机与应用,2022,12(2):32-36. 被引量：1

同被引文献2

1方义秋,刘飞,葛君伟.基于Mogrifier LSTM的序列标注关系抽取方法[J].计算机工程,2022,48(10):81-87. 被引量：2
2程春雷,邹静,叶青,张素华,蓝勇,杨瑞.融入关系形式化概念的端到端三元组抽取[J].计算机工程与应用,2023,59(9):182-189. 被引量：1

引证文献1

1陈泉林,贾珺,樊硕.结合Roberta和Bi-FLASH-SRU的中文事件因果关系抽取[J].计算机系统应用,2024,33(6):259-267.

1李世龙,张浩军,李大岭,王家慧,齐晨阳.一种基于层叠指针网络的实体关系抽取——对新工科视角下高等教育的研究[J].现代信息科技,2023,7(7):11-14.
2徐文明,林桐.具身认知理论视角下心理健康课的设计[J].教育观察,2023,12(2):27-29. 被引量：1
3杨宇伦,凌铭.基于改进鸡群优化算法的质子交换膜燃料电池模型参数辨识[J].太阳能学报,2023,44(2):269-278. 被引量：4
4顾文哲,郭军,董蔼萱,崔中健.基于Equation Chapter 1 Section 1自适应特征融合的遥感图像语义分割[J].中文科技期刊数据库（引文版）工程技术,2021(8):147-149.
5任国华,吕国英,李茹,王燕.融合框架表示的汉语框架网词元扩充[J].计算机应用与软件,2023,40(4):122-127.
6李光阳,潘家文,钱谦,殷继彬,伏云发,冯勇.融合学习机制的多混沌麻雀搜索算法[J].计算机科学与探索,2023,17(5):1057-1074. 被引量：3
7李英玲,兰宏富,李苒,黄闽英.基于CodeBERT的代码提交分类研究[J].西南民族大学学报（自然科学版）,2023,49(2):189-196.
8冯蕴雯,王锐,卢涛,陈俊宇,路成.基于多策略协同优化神经网络的起落架状态监测[J].西北工业大学学报,2023,41(2):264-273.
9宋春雷,赵旭俊,高亚星,晋广印.采用分段特征表示的异常序列检测算法[J].计算机工程与应用,2023,59(9):262-271. 被引量：1

计算机工程与应用

2023年第9期

浏览历史

内容加载中请稍等...

单步片段标注的实体关系联合抽取模型被引量：1

参考文献5

二级参考文献44

共引文献233

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

单步片段标注的实体关系联合抽取模型 被引量：1

参考文献5

二级参考文献44

共引文献233

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

单步片段标注的实体关系联合抽取模型被引量：1