基于BERT-IDCNN-CRF的中文命名实体识别方法被引量：54

BERT-IDCNN-CRF for named entity recognition in Chinese

导出

摘要预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识别方法中,存在的问题是训练参数过多,训练时间过长。针对这个问题提出了基于BERT-IDCNN-CRF(BERT-iterated dilated convolutional neural network-conditional random field)的中文命名实体识别方法,该方法通过BERT预训练语言模型得到字的上下文表示,再将字向量序列输入IDCNN-CRF模型中进行训练,训练过程中保持BERT参数不变,只训练IDCNN-CRF部分,在保持多义性的同时减少了训练参数。实验表明,该模型在MSRA语料上F1值能够达到94.41%,在中文命名实体任务上优于目前最好的Lattice-LSTM模型,提高了1.23%;与基于BERT微调的方法相比,该方法的F1值略低但是训练时间大幅度缩短。将该模型应用于信息安全、电网电磁环境舆情等领域的敏感实体识别,速度更快,响应更及时。 The pre-trained language model,BERT(bidirectional encoder representations from transformers),has shown promising result in NER(named entity recognition)due to its ability to represent rich syntactic,grammatical information in sentences and the polysemy of words.However,most existing BERT fine-tuning based models need to update lots of model parameters,facing with expensive time cost at both training and testing phases.To handle this problem,this work presents a novel BERT based language model for Chinese NER,named BERT-IDCNN-CRF(BERT-iterated dilated convolutional neural network-conditional random field).The proposed model utilizes traditional BERT model to obtain the context representation of the word as the input of IDCNN-CRF.At training phase,the model parameters of BERT in the proposed model remain unchanged so that the proposed model can reduce parameters training while maintaining polysemy of words.Experimental results show that the proposed model obtains significant training time with acceptable test error.

作者李妮关焕梅杨飘董文永 LI Ni;GUAN Huan-mei;YANG Piao;DONG Wen-yong(State Key Laboratory of Power Grid Environmental Protection,China Electric Power Research Institute,Wuhan 430074,Hubei,China;School of Computer Science,Wuhan University,Wuhan 430072,Hubei,China)

机构地区中国电力科学研究院有限公司电网环境保护国家重点实验室武汉大学计算机学院

出处《山东大学学报（理学版）》 CAS CSCD 北大核心 2020年第1期102-109,共8页 Journal of Shandong University(Natural Science)

基金国家电网公司总部科技项目(GY71-18-009).

关键词中文命名实体识别 BERT模型膨胀卷积条件随机场信息安全 NER in Chinese BERT IDCNN CRF information security

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1ZHOU Junsheng,QU Weiguang,ZHANG Fen.Chinese Named Entity Recognition_via Joint Identification and Categorization[J].Chinese Journal of Electronics,2013,22(2):225-230. 被引量：21

二级参考文献18

1Gina-Anne Levow, “The third international Chinese languageprocessing bakeoff: Word segmentation and named entity recog-nition”,Proc. of the Fifth SIGHAN Workshop on Chinese Lan-guage Processing, Sydney, Australia, pp.108-117, 2006.
2H. Zhang, Q. Liu, H.K. Yu, Y.Q. Cheng and S. Bai, “Chi-nese named entity recognition using role model,,, Computa-tional Linguistics and Chinese Language Processing, Vol.8,No.2, pp.29-60,2003.
3H. Zhang, Q. Liu, H.K. Yu, Y.Q. Cheng and S. Bai, “Chi-nese named entity recognition using role model,,, Computa-tional Linguistics and Chinese Language Processing, Vol.8,No.2, pp.29-60,2003.
4W. Chen, Yujie Zhang and Hitoshi Isahara, “Chinese namedentity recognition with conditional random fields”,Proc. of 5thSIGHAN Workshop on Chinese Language Processing, Sydney,Australia, pp.118-121, 2006.
5J. Zhou, L. He, X. Dai and J. Chen, “Chinese named entityrecognition with a multiphase model”,Proc. of 5th SIGHANWorkshop on Chinese Language Processing, Sydney, Australia,pp.213-216, 2006.
6A. Chen, F. Peng, R. Shan and G. Sun, “Chinese named entityrecognition with conditional probabilistic models", Proc. of 5thSIGHAN Workshop on Chinese Language Processing, Sydney,Australia, pp.173-176, 2006.
7J. Lafferty, A. McCallum and F. Pereira, “Conditional ran-dom fields: Probabilistic models for segmenting and labelingsequence data”, Proc. of ICML, San Francisco, USA, pp.282-289, 2001.
8Yue Zhang and Stephen Clark, “Joint word segmentation andPOS tagging using a single perceptron”,Proc. of ACL/HLT,Columbus, OH, pp.888-896, 2008.
9Yue Zhang and Stephen Clark, “A fast decoder for joint wordsegmentation and POS-tagging using a single discriminativemodel”,Proc. of EM NLP, Cambridge, MA, pp.843-852, 2010.
10W. Jiang, Haitao Mi and Qun Liu, “Word lattice reranking forChinese word segmentation and part-of-speech tagging,,,Proc.of COLING, Manchester, UK, pp.385-392, 2008.

共引文献20

1于舒娟,毛新涛,张昀,黄丽亚.基于词典和字形特征的中文命名实体识别[J].中文信息学报,2023,37(3):112-122. 被引量：2
2WANG Jing,LIU Zhijing,ZHAO Hui.Micro-blogs Entity Recognition Based on DSTCRF[J].Chinese Journal of Electronics,2014,23(1):147-150. 被引量：3
3尹存燕,黄书剑,戴新宇,陈家骏.中英命名实体识别及对齐中的中文分词优化[J].电子学报,2015,43(8):1481-1487. 被引量：6
4王蕾,谢云,周俊生,顾彦慧,曲维光.基于神经网络的片段级中文命名实体识别[J].中文信息学报,2018,32(3):84-90. 被引量：20
5石春丹,秦岭.基于BGRU-CRF的中文命名实体识别方法[J].计算机科学,2019,46(9):237-242. 被引量：29
6殷章志,李欣子,黄德根,李玖一.融合字词模型的中文命名实体识别研究[J].中文信息学报,2019,33(11):95-100. 被引量：41
7Jize Yin,Senlin Luo,Zhouting Wu,Limin Pan.Chinese Named Entity Recognition with Character-Level BLSTM and Soft Attention Model[J].Journal of Beijing Institute of Technology,2020,29(1):60-71. 被引量：1
8Chen GONG,Zhenghua LI,Qingrong XIA,Wenliang CHEN,Min ZHANG.Hierarchical LSTM with char-subword-word tree-structure representation for Chinese named entity recognition[J].Science China(Information Sciences),2020,63(10):70-84. 被引量：4
9陈茹,卢先领.融合空洞卷积神经网络与层次注意力机制的中文命名实体识别[J].中文信息学报,2020,34(8):70-77. 被引量：12
10张欣欣,刘小明,刘研.基于语言模型的中文命名实体识别研究[J].中原工学院学报,2020,31(5):66-71.

同被引文献381

1肖瑞,胡冯菊,裴卫.基于BiLSTM-CRF的中医文本命名实体识别[J].世界科学技术-中医药现代化,2020,22(7):2504-2510. 被引量：32
2赵丹群.文献计量范式下的科学知识图谱研究:新进展与新挑战[J].情报学进展,2020(1):354-380. 被引量：9
3王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：29
4马进,杨一帆,陈文亮.基于远程监督的人物属性抽取研究[J].中文信息学报,2020(6):64-72. 被引量：11
5成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
6刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
7张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：67
8向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
9俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
10周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112

引证文献54

1李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622. 被引量：1
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：21
4王卫红,冯倩,吕红燕,曹玉辉.基于Seq2Seq模型的命名实体识别方法[J].智能计算机与应用,2020(7):141-146.
5谢腾,杨俊安,刘辉.基于BERT-BiLSTM-CRF模型的中文实体识别[J].计算机系统应用,2020,29(7):48-55. 被引量：93
6王雪梅,陶宏才.基于深度学习的中文命名实体识别研究[J].成都信息工程大学学报,2020,35(3):264-270. 被引量：6
7吴小雪,张庆辉.预训练语言模型在中文电子病历命名实体识别上的应用[J].电子质量,2020(9):61-65. 被引量：3
8石教祥,朱礼军,望俊成,王政,魏超.面向少量标注数据的命名实体识别研究[J].情报工程,2020,6(4):37-50. 被引量：8
9胡万亭,郭建英,张继永.一种基于改进ELMO模型的组织机构名识别方法[J].计算机技术与发展,2020,30(11):25-29.
10郭旭超,唐詹,刁磊,周晗,李林.基于部首嵌入和注意力机制的病虫害命名实体识别[J].农业机械学报,2020,51(S02):335-343. 被引量：21

二级引证文献334

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：2
4闫云才,郝硕亨,高亚玲,辛迪,牛子杰.基于空地多源信息的猕猴桃果园病虫害检测方法[J].农业机械学报,2023,54(S02):294-300. 被引量：5
5李书琴,张明美,刘斌.融合字词语义信息的猕猴桃种植领域命名实体识别研究[J].农业机械学报,2022,53(12):323-331. 被引量：5
6唐詹,柏召,刁磊,郭旭超,周晗,李林.基于注意力池化和堆叠式结构的病虫害文献识别模型[J].农业机械学报,2021,52(S01):178-184. 被引量：2
7张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：12
8刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
9余克健,张程,乐毅,吴云志.基于GPT修正农业病虫害命名实体识别方法[J].内蒙古农业大学学报（自然科学版）,2023,44(5):34-43. 被引量：2
10孙红,王哲.多粒度融合的命名实体识别[J].中文信息学报,2023,37(3):123-134.

1刘小安,彭涛.基于卷积神经网络的中文景点识别研究[J].计算机工程与应用,2020,56(4):140-145. 被引量：16
2杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：104
3程名,于红,冯艳红,任媛,付博,刘巨升,杨鹤.融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别[J].大连海洋大学学报,2020,35(2):296-301. 被引量：17
4李芦生.馆藏景德镇陶瓷珍品名称英译中的归化与异化策略探讨[J].大观（论坛）,2019,0(10):165-166.
5叶颖江,沈琳,王杉.规范胃肠间质瘤中文命名的建议[J].中华胃肠外科杂志,2020,23(2):169-169.
6孙超,谢晴宇.中医病历术语识别方法探讨[J].中国中医药图书情报杂志,2020,44(2):1-5. 被引量：2
7陈玉娜,史晓东.通过标点恢复提高机器同传效果[J].计算机应用,2020,40(4):972-977. 被引量：1
8陶源,彭艳兵.基于门控CNN-CRF的中文命名实体识别[J].电子设计工程,2020,28(4):42-46. 被引量：11
9Xi-Qi Yang,Qing-Feng Zhang,Zhan Li.Contour detection in Cassini ISS images based on Hierarchical Extreme Learning Machine and Dense Conditional Random Field[J].Research in Astronomy and Astrophysics,2020,20(1):83-92.
10市场到底还需不需要一台漂亮的2.0T中级四驱SUV?[J].中国汽车市场,2019,0(12):46-49.

山东大学学报（理学版）

2020年第1期

浏览历史

内容加载中请稍等...

基于BERT-IDCNN-CRF的中文命名实体识别方法被引量：54

参考文献1

二级参考文献18

共引文献20

同被引文献381

引证文献54

二级引证文献334

相关作者

相关机构

相关主题

浏览历史

基于BERT-IDCNN-CRF的中文命名实体识别方法 被引量：54

参考文献1

二级参考文献18

共引文献20

同被引文献381

引证文献54

二级引证文献334

相关作者

相关机构

相关主题

浏览历史

基于BERT-IDCNN-CRF的中文命名实体识别方法被引量：54