融入语言模型和注意力机制的临床电子病历命名实体识别被引量：22

Clinical Electronic Medical Record Named Entity Recognition Incorporating Language Model

下载PDF

导出

摘要临床电子病历命名实体识别(Clinical Named Entity Recognition,CNER)的主要任务是对给定的一组电子病历文档进行识别并抽取出与医学临床相关的命名实体,然后将它们归类到预先定义好的类别中,如疾病、症状、检查等实体。命名实体识别任务通常被看作一个序列标注问题。目前,深度学习方法已经被广泛应用于该任务并取得了非常好的效果。但其中大部分方法未能有效利用大量的未标注数据;并且目前使用的特征相对简单,未能深入捕捉病历文本自身的特征。针对这两个问题,文中提出一种融入语言模型和注意力机制的深度学习方法。该方法首先从未标注的临床医疗数据中训练字符向量和语言模型,然后利用标注数据来训练标注模型。具体地,将句子的向量表示送入一个双向门控循环网络(Bidirectional Gated Recurrent Units,BiGRU)和预训练好的语言模型,并将两部分的输出进行拼接。之后,将前一层的拼接向量输入另一个BiGRU和多头注意力(Multi-head Attention)模块。最后,将BiGRU和多头注意力模块的输出进行拼接并输入条件随机场(Conditional Randoin Field,CRF),预测全局最优的标签序列。通过利用语言模型特征和多头注意力机制,该方法在CCKS-2017 Shared Task2标准数据集上取得了良好的结果(F1值为91.34%)。 Clinical Named Entity Recognition(CNER)aims to identify and classify named entity such as diseases,symptoms,exams,etc.in electronic health records,which is a fundamental and crucial task for clinical and translational research.The task is regarded as a sequence labeling problem.In recent years,deep neural network methods achieve significant success in named entity recognition.However,most of these algorithms do not take full advantages of the large amount of unlabeled data,and ignore the further features from the text.This paper proposed a model which combines language model and multi-head attention.First,chara-cter embeddings and a language model are trained from unlabeled clinical texts.Then,the labeling model are trained from labeled clinical texts.In specific use,the vector representation of the sentence is sent to a BiGRU and a pre-trained language model.This paper further concatenate the output of BiGRU and the features of language model.Afterwards,the outputs are fed to another BiGRU and multi-head attention module.Finally,a CRF layer is employed to predict the label sequence.Experimental results show that the proposed method which takes advantages of language model from the text and multi-head attention mechanism gets 91.34%of F1-score on CCKS-2017 Task2 benchmark dataset.

作者唐国强高大启阮彤叶琪王祺 TANG Guo-qiang;GAO Da-qi;RUAN Tong;YE Qi;WANG Qi(School of information Science and Engineering,East China University of Science and Technology,Shanghai 200237,China)

机构地区华东理工大学信息科学与工程学院

出处《计算机科学》 CSCD 北大核心 2020年第3期211-216,共6页 Computer Science

基金国家重点研发计划(2018YFC0910500)~~

关键词多头注意力语言模型临床医学命名实体识别深度神经网络循环控制单元 Multi-head attention Language model Clinical named entity recognition Deep neural network GRU

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1电子病历基本规范（试行）[J].中国社区医学,2010(1):13-14. 被引量：1

同被引文献209

1付秀,陈麒麟,李杰,付毅,包国峰.基于智能预问诊的全景多学科会诊平台的设计与应用[J].中国数字医学,2021,16(10):79-82. 被引量：6
2刘清堂,杨炜钦,吴林静,贺黎鸣,李晶,马晶晶.初等数学应用题题意理解中的常识库系统构建[J].计算机系统应用,2020,29(12):72-79. 被引量：1
3屈丹丹,杨涛,朱垚,胡孔法.基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021,23(9):3118-3125. 被引量：3
4张政馗,庞为光,谢文静,吕鸣松,王义.面向实时应用的深度学习研究综述[J].软件学报,2020(9):2654-2677. 被引量：33
5张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：9
6成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：6
7黄超.基于统计方法从文本中抽取分词词典[J].电脑知识与技术,2020,0(4):213-214. 被引量：2
8张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：65
9吴平博,陈群秀,马亮.基于时空分析的线索性事件的抽取与集成系统研究[J].中文信息学报,2006,20(1):21-28. 被引量：21
10王浩畅,赵铁军.基于SVM的生物医学命名实体的识别[J].哈尔滨工程大学学报,2006,27(B07):570-574. 被引量：18

引证文献22

1张硕,赵卓峰,刘晨.基于图卷积网络的产业领域科技服务资源命名实体识别[J].计算机与数字工程,2023,51(1):20-27.
2沈宙锋,苏前敏,朱城.基于条件随机场模型的制造企业实体识别方法研究[J].制造业自动化,2020,42(12):147-151. 被引量：1
3王佳雯,王剑,线岩团,余正涛.融入中心句的涉案新闻要素实体识别方法[J].通信技术,2021,54(4):835-841.
4李易真,夏椰,张佳玮,张雨楠,赵磊,窦智丽,韩东燃.中医药大数据在真实世界中的应用现状研究进展[J].中华中医药杂志,2021,36(6):3471-3474. 被引量：6
5巩敦卫,张永凯,郭一楠,王斌,樊宽鲁,火焱.融合多特征嵌入与注意力机制的中文电子病历命名实体识别[J].工程科学学报,2021,43(9):1190-1196. 被引量：9
6廖涛,宋杨,张顺香.基于双维注意力机制的事件要素识别方法[J].安徽理工大学学报（自然科学版）,2021,41(4):25-30.
7宋杨,廖涛,张顺香.基于多特征多注意力模型的中文事件关系识别[J].现代电子技术,2022,45(18):153-158.
8陈鹏,苏志同,余肖生.结合神经文本生成的FLAT模型的中文电子病历命名实体识别[J].重庆理工大学学报（自然科学）,2022,36(9):98-109.
9张杰,黄杰,万健.基于半监督学习的中文电子病历命名实体识别[J].浙江科技学院学报,2022,34(6):502-511. 被引量：1
10廖涛,陈彦杰,张顺香.融合字词特征的BiGRU-CRF中文事件要素识别[J].阜阳师范大学学报（自然科学版）,2022,39(4):50-55. 被引量：1

二级引证文献22

1班晓娟.“健康中国”行动下的智慧医疗[J].工程科学学报,2021,43(9):1137-1139. 被引量：4
2钟小梅.基于空中、地面、旅客偏好的机场群系统配流[J].信息技术,2022,46(3):103-108.
3孙超,张文博.中医古籍文本术语命名实体识别的研究进展与挑战[J].中华中医药杂志,2021,36(11):6843-6845. 被引量：1
4仲雨乐,马诗雯,陆豪杰,韩普.基于机器学习的药品不良反应实体识别研究综述[J].软件工程,2022,25(8):1-6. 被引量：3
5崔鑫,黎元元,陈卫衡,徐祖健,高景华,谢雁鸣,王连心.3033例基于主动监测的舒筋健腰丸真实世界安全性医院集中监测[J].中国实验方剂学杂志,2022,28(15):102-110. 被引量：4
6于鹏,陈钰枫,徐金安,张玉洁.基于多任务学习的电子病历实体识别方法[J].计算机与现代化,2022(9):40-50.
7吴智妍,金卫,岳路,生慧.电子病历命名实体识别技术研究综述[J].计算机工程与应用,2022,58(21):13-29. 被引量：5
8李曼玉,于瓅.融入对抗训练的中文电子病历命名实体识别[J].现代信息科技,2023,7(2):90-93. 被引量：1
9张雨楠,李易真,窦智丽,赵磊,张佳玮,韩东燃.真实世界针灸大数据研究现状、问题与解决路径[J].中华中医药杂志,2023,38(2):695-698.
10程燕飞,叶然,葛莹莹,魏冕,黄晶晶.基于数据挖掘的中医食疗方调治小儿积滞的规律研究[J].中国实用护理杂志,2023,39(2):138-143.

1胡婧,刘伟,马凯.基于机器学习的高血压病历文本分类[J].科学技术与工程,2019,19(33):296-301. 被引量：8
2刘庆峰,代旭东,吴桂平,盛志超.要素抽取技术在智慧司法中的应用研究[J].信息周刊,2019(40):0030-0033.
3曹春萍,关鹏举.基于E-CNN和BLSTM-CRF的临床文本命名实体识别[J].计算机应用研究,2019,36(12):3748-3751. 被引量：15
4本刊编辑部.本刊2020年征订启事[J].中华围产医学杂志,2020,23(1):55-55.
5李鹏,尹艳,刘伟.一种基于免疫算法的医疗临床路径挖掘算法研究[J].计算机与数字工程,2019,47(11):2753-2756. 被引量：3
6杨维,孙德艳,张晓慧,李子乾,李承桓,吴佐平.面向电力智能问答系统的命名实体识别算法[J].计算机工程与设计,2019,40(12):3625-3630. 被引量：17
7本刊编辑部.《华南国防医学杂志》稿约[J].华南国防医学杂志,2019,33(11).
8李亚莹.基于异构信息网络表征学习的推荐方法[J].现代计算机,2020,26(4):7-10. 被引量：1
9《精神医学杂志》稿约[J].精神医学杂志,2019,32(3).
10Zhijuan Wang,Xiaobin Zhao,Wei Song,Antai Wang.Readability Assessment of Textbooks in Low Resource Languages[J].Computers, Materials & Continua,2019(7):213-225.

计算机科学

2020年第3期

浏览历史

内容加载中请稍等...

融入语言模型和注意力机制的临床电子病历命名实体识别被引量：22

参考文献1

同被引文献209

引证文献22

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

融入语言模型和注意力机制的临床电子病历命名实体识别 被引量：22

参考文献1

同被引文献209

引证文献22

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

融入语言模型和注意力机制的临床电子病历命名实体识别被引量：22