基于BERT-BiLSTM-MHA-CRF的中文命名实体识别方法

Chinese Named Entity Recognition Method Based on BERT-BiLSTM-MHA-CRF Model

下载PDF

导出

摘要针对目前中文命名实体识别研究中存在的语义特征提取不充分,不全面等问题,提出了一种基于BERT-BiLSTM-MHA-CRF的中文命名实体识别方法。该方法首先采用BERT预训练语义模型来获取输入文本的动态词向量表示,从而更好地解决一词多义问题,然后通过BiLSTM网络结合多头注意力机制从多个维度提取出文本的语义特征,最后通过CRF层来获取全局最优的标签序列。该方法利用MSRA数据集和人民日报数据集进行实验分析,结果优于其他对比模型。 Aiming at the problems of insufficient and incomplete semantic feature extraction in Chinese named entity recognition,a Chinese named entity recognition method based on BERT-BiLSTM-MHA-CRF is proposed.Firstly,the BERT pre-trained semantic model is used to obtain the dynamic word vector representation of the input text,so as to better solve the polysemous problem.Then,BiLSTM network and multi-attention mechanism are used to extract the semantic features of the text from multiple dimensions.Finally,the CRF layer is used to obtain the globally optimal label sequence.The experimental results of this method using MSRA and People's Daily data sets are better than other comparison models.

作者夏成魁李少波 XIA Chengkui;LI Shaobo(College of Computer Science and Technology,Guizhou University,Guiyang 550025;State Key Laboratory of Public Big Data,Guizhou University,Guiyang 550025)

机构地区贵州大学计算机科学与技术学院贵州大学公共大数据国家重点实验室

出处《计算机与数字工程》 2023年第9期2087-2091,2102,共6页 Computer & Digital Engineering

关键词命名实体识别预训练模型多头注意力机制深度学习 named entity recognition pre-training model multi-head-attention deep learning

分类号 O235 [理学—运筹学与控制论]

引文网络
相关文献

参考文献10

1陈曙东,欧阳小叶.命名实体识别技术综述[J].无线电通信技术,2020,46(3):251-260. 被引量：60
2乐娟,赵玺.基于HMM的京剧机构命名实体识别算法[J].计算机工程,2013,39(6):266-271. 被引量：18
3何彬,关毅.基于字级别条件随机场的医学实体识别[J].智能计算机与应用,2019,9(2):130-134. 被引量：6
4李纲,潘荣清,毛进,操玉杰.整合BiLSTM-CRF网络和词典资源的中文电子病历实体识别[J].现代情报,2020,40(4):3-12. 被引量：29
5石春丹,秦岭.基于BGRU-CRF的中文命名实体识别方法[J].计算机科学,2019,46(9):237-242. 被引量：29
6李韧,李童,杨建喜,莫天金,蒋仕新,李东.基于Transformer-BiLSTM-CRF的桥梁检测领域命名实体识别[J].中文信息学报,2021,35(4):83-91. 被引量：19
7王传涛,丁林楷,杨学鑫,胡琦.基于BERT的中文电子简历命名实体识别[J].中国科技论文,2021,16(7):770-775. 被引量：12
8李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
9袁健,章海波.多粒度融合嵌入的中文实体识别模型[J].小型微型计算机系统,2022,43(4):741-746. 被引量：6
10焦凯楠,李欣,朱容辰.中文领域命名实体识别综述[J].计算机工程与应用,2021,57(16):1-15. 被引量：41

二级参考文献78

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：54
2刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
3俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
4张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：20
5Chinchor N A.Overview of MUC-7/MET-2[C]//Proc.of the 7th Message Understanding Conference.Fairfax, Virginia: [s.n.], 1998.
6俞鸿魁, 张华平, 刘群.基于角色标注的中文机构名识别[C]//Proc.of the 20th International Conference on Computer Processing of Oriental Languages.Shenyang, China: [s.n.], 2003.
7Gao Wen, Fang Gaolin, Zhao Debin.A Chinese Sign Language Recognition System Based on SOFM/SRN/ HMM[J].Pattern Recognition, 2004, 37(12): 2389-2402.
8Boyle R.HMM Turorial[EB/OL].(2012-01-01).http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html.
9Fleming C.A Tutorial on Convolutional Coding with Viterbi Decoding, Spectrum Applications[EB/OL].(2011-06-21).http:// home.netcom.com/~chip.f/viterbi/tutorial.html.
10罗刚.自然语言处理技术与实现[M].北京: 电子工业出版社, 2009.

共引文献228

1李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622. 被引量：1
2屈丹丹,杨涛,朱垚,胡孔法.基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021,23(9):3118-3125. 被引量：6
3步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
4刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：2
5李书琴,张明美,刘斌.融合字词语义信息的猕猴桃种植领域命名实体识别研究[J].农业机械学报,2022,53(12):323-331. 被引量：5
6刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
7李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：21
8成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
9张秋颖,傅洛伊,王新兵.基于BERT-BiLSTM-CRF的学者主页信息抽取[J].计算机应用研究,2020,37(S01):47-49. 被引量：14
10王卫红,冯倩,吕红燕,曹玉辉.基于Seq2Seq模型的命名实体识别方法[J].智能计算机与应用,2020(7):141-146.

1张欣艺,郑军红,何利力.基于CNN-BiLSTM-CRF的企业舆情监控模型构建[J].计算机时代,2023(11):136-140.
2宋卫强,李焰.基于BERT-IDCNN-CRF的医疗命名实体识别[J].电脑与信息技术,2023,31(6):53-57.
3王欢,王兴芬,吕金娜.面向金融文本的实体关系抽取方法[J].计算机工程与设计,2023,44(11):3345-3351. 被引量：2
4季长清,高志勇,秦静,汪祖民.基于Transformer的航空目标检测算法[J].无线电工程,2023,53(12):2811-2819.
5卢恒,陈章杰,周知.基于知识图谱的虚拟学术社区用户生成内容知识共聚框架研究[J].情报理论与实践,2023,46(12):157-166. 被引量：2
6杨状状,宋瑞银,刘博宇,任聪杰,林躜,盛勇.一种新型带槽式Savonius叶轮参数多目标优化[J].水电能源科学,2023,41(12):203-206.
7陈世利,吕玲玲,童君开,刘洋.基于物理信息嵌入式神经网络的管壁导波成像[J].电子测量与仪器学报,2023,37(8):136-145.

计算机与数字工程

2023年第9期

浏览历史

内容加载中请稍等...

基于BERT-BiLSTM-MHA-CRF的中文命名实体识别方法

参考文献10

二级参考文献78

共引文献228

相关作者

相关机构

相关主题

浏览历史