基于BERT嵌入的中文命名实体识别方法被引量：90

Chinese Named Entity Recognition Method Based on BERT Embedding

下载PDF

导出

摘要在基于神经网络的中文命名实体识别过程中,字的向量化表示是重要步骤,而传统的词向量表示方法只是将字映射为单一向量,无法表征字的多义性.针对该问题,通过嵌入BERT预训练语言模型,构建BERT-BiGRU-CRF模型用于表征语句特征.利用具有双向Transformer结构的BERT预训练语言模型增强字的语义表示,根据其上下文动态生成语义向量.在此基础上,将字向量序列输入BiGRU-CRF模型中进行训练,包括训练整个模型和固定BERT只训练BiGRU-CRF2种方式.在MSRA语料上的实验结果表明,该模型2种训练方式的F1值分别达到95.43%和94.18%,优于BiGRU-CRF、Radical-BiLSTM-CRF和Lattice-LSTM-CRF模型. In Chinese Named Entity Recognition(NER)based on neural network,the vectorized representation of words is an important step.Traditional representation methods for word vectors only map a word to a single vector,and cannot represent the polysemy of a word.To address the problem,this paper introduces the BERT pretrained language model to build a BERT-BiGRU-CRF model for representation of sentence characteristics.The BERT pretrained language model with bidirectional Transformer structure is used to enhance the semantic representation of words and generate semantic vectors dynamically based on their context.On this basis,the word vector sequence is input into the BIGR-CRF model to train the whole model,or train the BIGR-CRF part only with BERT fixed.Experimental results on MSRA data show that the F1 value in the two training modes of this proposed model reaches 95.43%and 94.18%respectively,which is better than that of the BIGRU-CRF,the RADICAL-BILSTM-CRF and the GRAIN-LSTM-CRF models.

作者杨飘董文永 YANG Piao;DONG Wenyong(School of Computer Science,Wuhan University,Wuhan 430072,China)

机构地区武汉大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第4期40-45,52,共7页 Computer Engineering

基金国家自然科学基金(61672024) 国家重点研发计划“智能电网技术与装备”重点专项(2018YFB0904200)。

关键词中文命名实体识别 BERT模型 BiGRU模型预训练语言模型条件随机场 Chinese Named Entity Recognition(NER) BERT model BiGRU model pretrained language model Conditional Random Field(CRF)

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1周晓磊,赵薛蛟,刘堂亮,宗子潇,王其乐,里剑桥.基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法[J].计算机系统应用,2019,28(1):245-250. 被引量：13
2杨文明,褚伟杰.在线医疗问答文本的命名实体识别[J].计算机系统应用,2019,28(2):8-14. 被引量：22
3杨培,杨志豪,罗凌,林鸿飞,王健.基于注意机制的化学药物命名实体识别[J].计算机研究与发展,2018,55(7):1548-1556. 被引量：36
4王洁,张瑞东,吴晨生.基于GRU的命名实体识别方法[J].计算机系统应用,2018,27(9):18-24. 被引量：9
5李丽双,郭元凯.基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J].中文信息学报,2018,32(1):116-122. 被引量：114

二级参考文献6

1邱泉清,苗夺谦,张志飞.中文微博命名实体识别[J].计算机科学,2013,40(6):196-198. 被引量：33
2王宁,葛瑞芳,苑春法,黄锦辉,李文捷.中文金融新闻中公司名的识别[J].中文信息学报,2002,16(2):1-6. 被引量：47
3杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：121
4苏娅,刘杰,黄亚楼.在线医疗文本中的实体识别研究[J].北京大学学报（自然科学版）,2016,52(1):1-9. 被引量：16
5张帆,王敏.基于深度学习的医疗命名实体识别[J].计算技术与自动化,2017,36(1):123-127. 被引量：19
6刘玉娇,琚生根,李若晨,金玉.基于深度学习的中文微博命名实体识别[J].四川大学学报（工程科学版）,2016,48(S2):142-146. 被引量：14

共引文献161

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2贺金龙,付立军,姚郑,吕鹏飞,黄徐胜.基于网格LSTM混合算法的地质领域用户意图识别[J].计算机系统应用,2020(10):44-52. 被引量：1
3步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
4李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：13
5张秋颖,傅洛伊,王新兵.基于BERT-BiLSTM-CRF的学者主页信息抽取[J].计算机应用研究,2020,37(S01):47-49. 被引量：13
6杨晓燕,徐戈,谢安,庄泽彬.基于词典与条件随机场的中文菜名识别研究[J].信息与电脑,2018,30(17):91-93. 被引量：1
7薛蕊,马小宁,李平,杨连报.自然语言处理关键技术在智能铁路中的应用研究[J].铁路计算机应用,2018,27(10):40-43. 被引量：4
8黄晴雁,牟永敏.命名实体识别方法研究进展[J].现代计算机（中旬刊）,2018(12):12-17. 被引量：4
9修晓蕾,吴思竹,崔佳伟,邬金鸣,钱庆.医学知识图谱构建研究进展[J].中华医学图书情报杂志,2018,27(10):33-39. 被引量：11
10佟威,汪飞,刘淇,陈恩红.数据驱动的数学试题难度预测[J].计算机研究与发展,2019,56(5):1007-1019. 被引量：9

同被引文献667

1陈瑶,吴红,葛卫红,张海霞,廖俊.基于深度学习模型的我国药品不良反应报告实体关系抽取研究[J].中国药科大学学报,2019,50(6):753-759. 被引量：8
2冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：46
3刘乐.虚假新闻的危害、成因及治理办法[J].新闻传播,2019,0(21):21-22. 被引量：1
4杜恒欣,朱习军.基于BiLSTMATTCNN中文专利文本分类[J].计算机系统应用,2020(11):260-265. 被引量：3
5喻国明,曲慧.“信息茧房”的误读与算法推送的必要——兼论内容分发中社会伦理困境的解决之道[J].新疆师范大学学报（哲学社会科学版）,2020,41(1):127-133. 被引量：98
6唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：39
7李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：48
8赵丹群.文献计量范式下的科学知识图谱研究:新进展与新挑战[J].情报学进展,2020(1):354-380. 被引量：8
9马月坤,刘鑫,裴嘉诚,秦帅波.基于BERT的中文关系抽取方法[J].计算机产品与流通,2019,0(12):251-251. 被引量：4
10李书琴,张明美,刘斌.融合字词语义信息的猕猴桃种植领域命名实体识别研究[J].农业机械学报,2022,53(12):323-331. 被引量：3

引证文献90

1屈丹丹,杨涛,朱垚,胡孔法.基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021,23(9):3118-3125. 被引量：3
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3陆晓蕾,倪斌.基于预训练语言模型的BERT-CNN多层级专利分类研究[J].中文信息学报,2021,35(11):70-79. 被引量：12
4吴俊,程垚,郝瀚,艾力亚尔·艾则孜,刘菲雪,苏亦坡.基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究[J].情报学报,2020,39(4):409-418. 被引量：45
5方英兰,孙吉祥,韩兵.基于BERT的文本情感分析方法的研究[J].信息技术与信息化,2020(2):108-111. 被引量：10
6孔祥鹏,吾守尔·斯拉木,杨启萌,李哲.基于迁移学习的维吾尔语命名实体识别[J].东北师大学报（自然科学版）,2020,52(2):58-65. 被引量：10
7王雪梅,陶宏才.基于深度学习的中文命名实体识别研究[J].成都信息工程大学学报,2020,35(3):264-270. 被引量：4
8陈琛.基于BiGRU_CRF模型的医疗领域命名实体识别[J].电子技术与软件工程,2020(14):180-182. 被引量：3
9卢佳伟,陈玮,尹钟.融合TextRank算法的中文短文本相似度计算[J].电子科技,2020,33(10):51-56. 被引量：4
10余传明,王曼怡,林虹君,朱星宇,黄婷婷,安璐.基于深度学习的词汇表示模型对比研究[J].数据分析与知识发现,2020,4(8):28-40. 被引量：6

二级引证文献466

1王栋,周菲,李颖芳,刘伟云,王甲威,张倩,崔冬冬.我国甜樱桃产业知识图谱构建研究[J].中国果树,2023(1):104-108. 被引量：1
2吴昀效,许璐,卓琳,王胜锋,詹思延.解决多中心药品安全性研究中变量丰度不同的策略及应用概述[J].药物流行病学杂志,2023,32(5):575-581.
3郭子晨,李昆阳,娄嘉鹏.基于深度学习的多通道多任务学习判决预测模型[J].北京电子科技学院学报,2022,30(4):105-114.
4朱丽雅,张珺,洪亮,罗绍辉,兰度.数字人文领域的知识图谱:研究进展与未来趋势[J].知识管理论坛,2022(1):87-100. 被引量：4
5赵梓博,王昊,刘友华,张卫,孟镇.多任务环境下融合迁移学习的新冠疫情新闻要素识别研究[J].知识管理论坛,2021(1):2-13. 被引量：1
6李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622.
7黄水清,刘浏,王东波.国内外数字人文研究进展[J].情报学进展,2022(1):50-84. 被引量：5
8谢晓璇,鄂海红,匡泽民,谭玲,周庚显,罗浩然,李峻迪,宋美娜.高血压超关系知识图谱建模及用药决策推理实践[J].中文信息学报,2023,37(3):65-78.
9刘焕勇,薛云志,李瑞,任红萍,陈贺,张鹏.面向开放文本的逻辑推理知识抽取与事件影响推理探索[J].中文信息学报,2021,35(10):56-63. 被引量：2
10张硕,赵卓峰,刘晨.基于图卷积网络的产业领域科技服务资源命名实体识别[J].计算机与数字工程,2023,51(1):20-27.

1刘小安,彭涛.基于卷积神经网络的中文景点识别研究[J].计算机工程与应用,2020,56(4):140-145. 被引量：14
2殷章志,李欣子,黄德根,李玖一.融合字词模型的中文命名实体识别研究[J].中文信息学报,2019,33(11):95-100. 被引量：38
3王子牛,姜猛,高建瓴,陈娅先.基于BERT的中文命名实体识别方法[J].计算机科学,2019,46(S11):138-142. 被引量：83
4黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：20
5Jintian Liang,Wentian Zeng,Pingjia Yao,Yuanan Wei.Lipase-catalyzed regioselective synthesis of palmitolyglucose ester in ionic liquids[J].Advances in Biological Chemistry,2012,2(3):226-232. 被引量：1
6陈东启,余勃,陆豫.RACE法克隆黑曲霉NCU-317中α-L-鼠李糖苷酶基因与生物信息学分析[J].南昌大学学报（理科版）,2019,43(5):489-496. 被引量：1
7赵薇,许铜华,王楠.基于深度学习的无人值守地面传感器目标检测与识别方法[J].战术导弹技术,2019(5):30-36. 被引量：1
8柳杨,吉立新,黄瑞阳,朱宇航,李星.基于门控卷积机制与层次注意力机制的多语义词向量计算方法[J].中文信息学报,2018,32(7):1-10. 被引量：4
9邱宁佳,周思丞,丛琳,王鹏,李岩芳.改进CNN的多通道语义合成情感分类模型研究[J].计算机工程与应用,2019,55(23):136-141. 被引量：5
10陶源,彭艳兵.基于门控CNN-CRF的中文命名实体识别[J].电子设计工程,2020,28(4):42-46. 被引量：11

计算机工程

2020年第4期

浏览历史

内容加载中请稍等...

基于BERT嵌入的中文命名实体识别方法被引量：90

参考文献5

二级参考文献6

共引文献161

同被引文献667

引证文献90

二级引证文献466

相关作者

相关机构

相关主题

浏览历史

基于BERT嵌入的中文命名实体识别方法 被引量：90

参考文献5

二级参考文献6

共引文献161

同被引文献667

引证文献90

二级引证文献466

相关作者

相关机构

相关主题

浏览历史

基于BERT嵌入的中文命名实体识别方法被引量：90