基于R-BERT-CNN模型的实体关系抽取被引量：1

ENTITY RELATIONSHIP EXTRACTION BASED ON R-BERT-CNN

下载PDF

导出

摘要针对传统实体关系抽取准确率不高,依赖人工标注且未能充分利用句子和目标实体语义的问题,提出一种预训练卷积神经网络模型(R-BERT-CNN)。将实体级信息融入预训练模型获取目标实体的语义;采用CNN提取句子级的语义信息;连接句子向量、标签向量和目标实体向量,获得全局信息;通过softmax分类器抽取实体关系。实验结果显示,在SemEval 2010 Task 8数据集上F1值达到了89.51%,比Attention-CNN、Att-Pooling-CNN模型分别提高3.61百分点和1.51百分点;比单独获取句子语义或目标实体语义的R-Bert、Bert-CNN模型分别提高2.61百分点和0.97百分点,训练时间分别缩短15和19 min。 Aimed at the problem of low accuracy of traditional entity relationship extraction,relying on manual annotation and failing to make full use of the semantics of sentences and target entities,a pre-trained convolutional neural network model(R-BERT-CNN)is proposed.The model integrated the entity-level information into the pre-training model to obtain the semantics of the target entity.CNN was used to extract the sentence-level semantic information.The sentence vector,label vector and target entity vector was connected to obtain global information.The entity relationship was extracted through the softmax classifier.The experimental results show that the F1 value on the SemEval 2010 Task 8 dataset reaches 89.51%,which is 3.61 percentage points and 1.51 percentage points higher than Attention-CNN and Att-Pooling-CNN models.Compared with the R-Bert and Bert-CNN models that obtain the semantics of the sentence or the target entity separately,the F1 value is improved by 2.61 percentage points and 0.97 percentage points respectively,and the training time is shortened by 15 min and 19 min respectively.

作者曹卫东徐秀丽 Cao Weidong;Xu Xiuli(School of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China)

机构地区中国民航大学计算机科学与技术学院

出处《计算机应用与软件》北大核心 2023年第4期222-229,共8页 Computer Applications and Software

基金国家自然科学基金民航联合基金项目(U1833114) 民航科技创新重大专项(MHRD20160109) 民航安全能力项目(TRSA201803)。

关键词预训练模型 BERT 卷积神经网络自然语言处理关系抽取 Pre-trained model BERT Convolutional neural network Natural language processing Relation extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1郭剑毅,陈鹏,余正涛,线岩团,毛存礼,赵君.基于多核融合的中文领域实体关系抽取[J].中文信息学报,2016,30(1):24-29. 被引量：19
2刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：58
3郭喜跃,何婷婷,胡小华,陈前军.基于句法语义特征的中文实体关系抽取[J].中文信息学报,2014,28(6):183-189. 被引量：49
4鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述[J].软件学报,2019,30(6):1793-1818. 被引量：161
5翟社平,段宏宇,李兆兆.基于BILSTM_CRF的知识图谱实体抽取方法[J].计算机应用与软件,2019,36(5):269-274. 被引量：23
6黄梦醒,李梦龙,韩惠蕊.基于电子病历的实体识别和知识图谱构建的研究[J].计算机应用研究,2019,36(12):3735-3739. 被引量：28

二级参考文献70

1车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
2何婷婷,徐超,李晶,赵君喆.基于种子自扩展的命名实体关系抽取方法[J].计算机工程,2006,32(21):183-184. 被引量：25
3刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
4刘群李素建.基于《知网》的词汇语义相似度计算.中文计算语言学,2002,7(2):59-76.
5C Aone,M Ramos Santacruz.Rees:A large-scale relation and event extraction system[C].In:Proc of the 6th Applied Natural Language Processing Conference.New York:ACM Press,2000.76-83.
6T Zhang.Regularized Winnow methods[C].In:Advances in Neural Information Processing Systems (NIPS) 13.Cambridge:MIT Press,2001.703-709.
7N Cristianini,J Shawe-Taylor,H Lodhi.Latent semantic kernels[J].Journal of Intelligent Information Systems,2002,18(2-3):127-152.
8B Sch(o)lkopf,A Smola,K-R Müller.Kernel principal component analysis[G].In:Advances in Kernel Methods:Support Vector Learning.Cambridge:MIT Press,1999.327-352.
9D Zelenko,C Aone,A Richardella.Kernel methods for relation extraction[J].Journal of Machine Learning Research,2003,3:1083-1106.
10M Collins,N Duffy.Convolution kernels for natural language[C].In:Proc of Neural Information Processing Systems (NIPS) 14.Cambridge:MIT Press,2001.

共引文献309

1葛世奇,孙新,寇桓锦,袁燕.基于预训练模型的政务领域实体关系抽取[J].情报工程,2022,8(4):3-13. 被引量：1
2周俊,郑彭元,袁立存,戈为溪,梁静.基于改进CASREL的水稻施肥知识图谱信息抽取研究[J].农业机械学报,2022,53(11):314-322. 被引量：5
3刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：11
4谢晓璇,鄂海红,匡泽民,谭玲,周庚显,罗浩然,李峻迪,宋美娜.高血压超关系知识图谱建模及用药决策推理实践[J].中文信息学报,2023,37(3):65-78.
5葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：5
6吴婷,孔芳.基于图注意力卷积神经网络的文档级关系抽取[J].中文信息学报,2021,35(10):73-80. 被引量：12
7王大阜,王静,邓志文,贾志勇,张浴日.深度学习赋能网络安全知识图谱实体关系联合抽取研究[J].中国电子科学研究院学报,2023,18(5):420-428. 被引量：1
8吴天昊,古丽拉·阿东别克.基于神经元块级别注意力机制的LSTM关系抽取[J].计算机应用研究,2020,37(S02):76-79. 被引量：6
9刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
10张秋颖,傅洛伊,王新兵.基于BERT-BiLSTM-CRF的学者主页信息抽取[J].计算机应用研究,2020,37(S01):47-49. 被引量：14

同被引文献7

1冯建周,宋沙沙,王元卓,刘亚坤,武红颖,龚昊.基于改进注意力机制的实体关系抽取方法[J].电子学报,2019,47(8):1692-1700. 被引量：18
2李卫疆,李涛,漆芳.基于多特征自注意力BLSTM的中文实体关系抽取[J].中文信息学报,2019,33(10):47-56. 被引量：25
3陈晓玲,唐丽玉,胡颖,江锋,彭巍,冯先超.基于ALBERT模型的园林植物知识实体与关系抽取方法[J].地球信息科学学报,2021,23(7):1208-1220. 被引量：6
4Yuan Huang,Zhixing Li,Wei Deng,Guoyin Wang,Zhimin Lin.D-BERT: Incorporating dependency-based attention into BERT for relation extraction[J].CAAI Transactions on Intelligence Technology,2021,6(4):417-425. 被引量：1
5江旭,钱雪忠,宋威.结合残差BiLSTM与句袋注意力的远程监督关系抽取[J].计算机工程,2022,48(10):110-115. 被引量：3
6季一木,汤淑宁,刘尚东,张旺,洪程,邱晨阳,刘强,肖婉.基于TransH的双重注意力机制远程监督关系抽取算法[J].南京邮电大学学报（自然科学版）,2022,42(6):70-78. 被引量：1
7李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量：178

引证文献1

1任乐,张仰森,刘帅康.基于深度学习的实体关系抽取研究综述[J].北京信息科技大学学报（自然科学版）,2023,38(6):70-79. 被引量：1

二级引证文献1

1李惠娇,苏博.自然语言处理领域国内发展态势分析[J].现代信息科技,2024,8(14):30-36.

1张智林,陈文亮.信息增强的医患对话理解[J].中文信息学报,2023,37(1):121-131.
2李攀霞,李亚轩.数字经济背景下的实体商超转型发展[J].全国流通经济,2023(3):16-19.
3全智,顾一帆.基于深度学习的射频电路空间辐射测试系统[J].仪器仪表学报,2022,43(12):248-257. 被引量：2
4刘珂,冷芳玲,施伯贻,郎祎,鲍玉斌.基于深度主动学习的实体关系联合抽取方法[J].郑州大学学报（理学版）,2023,55(3):34-40. 被引量：1
5张能,曾晓磊.虚拟教研室融入高校思政课建设的内在意蕴与实践进路[J].四川文理学院学报,2023,33(2):96-102. 被引量：1
6唐庆东,唐娅平.“先”在日常表达中的词义和功用分析[J].汉字文化,2022(22):112-114.
7吴冬梅,尹以鹏,宋婉莹,王静.改进YOLO v4算法的电动车驾驶员头盔佩戴检测[J].计算机仿真,2023,40(3):508-513. 被引量：6
8向南,张磊,陈红华.数字化情境下实体生鲜零售业态转型机理——基于物美集团的案例研究[J].复印报刊资料（贸易经济）,2022(6):26-37.
9年双渡.日本“折扣之王”的成功密码[J].市场营销文摘,2022(5):111-112.
10庄艳,杜杰,郑松柏.L-[1-13C]-苯丙氨酸呼气试验测定肝脏储备功能的增龄变化研究[J].中华老年医学杂志,2023,42(4):393-398. 被引量：1

计算机应用与软件

2023年第4期

浏览历史

内容加载中请稍等...

基于R-BERT-CNN模型的实体关系抽取被引量：1

参考文献6

二级参考文献70

共引文献309

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于R-BERT-CNN模型的实体关系抽取 被引量：1

参考文献6

二级参考文献70

共引文献309

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于R-BERT-CNN模型的实体关系抽取被引量：1