期刊文献+

基于融合条目词嵌入和注意力机制的自动ICD编码 被引量:8

Automated ICD Coding Based on Word Embedding with Entry Embedding and Attention Mechanism
下载PDF
导出
摘要 构建一种基于融合条目词嵌入和注意力机制的深度学习模型,可以充分利用电子病案中的多种非结构化文本数据,对病案首页的主要诊断进行自动ICD编码。该模型首先对含有病案条目的文本进行融合条目的词嵌入,并通过关键词注意力来丰富词级别的类别表示;然后利用词语注意力来突出重点词语的作用,增强文本表示;最后通过全连接神经网络分类器进行分类,输出ICD编码。通过在中文电子病案数据集上的消融实验,验证了融合条目词嵌入、关键词注意力和词语注意力的有效性;与多个基准模型相比,所建模型在对81种疾病的分类中取得最好的分类效果,可以有效地提高自动ICD编码的质量。 The authors propose a neural model based on word embedding with entry embedding and attention mechanism,which can make full use of the unstructured text in the electronic medical record to achieve automated ICD coding for the main diagnosis of the medical record home page.This method first embeds the words which contain the medical record entries into word embeddings,and enriches word-level representation based on keyword attention.Then,the word attention is used to highlight the role of key words and enhance the text representation.Finally,ICD codes are output by a fully connected neural network classifier.Ablation study on a Chinese electronic medical record data set shows that word embedding with entry embedding,keyword attention and word attention is effective.The proposed model gets the best results for 81 diseases classification compared with baselines and can effectively improve the quality of automated ICD coding.
作者 张虹科 付振新 任前平 徐辉 赵东岩 严睿 ZHANG Hongke;FU Zhenxin;REN Qianping;XU Hui;ZHAO Dongyan;YAN Rui(Wangxuan Institute of Computer Technology,Peking University,Beijing 100871;Gennlife(Beijing)Technology Ltd,Beijing 100080)
出处 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期1-8,共8页 Acta Scientiarum Naturalium Universitatis Pekinensis
基金 国家重点研发计划(2017YFC0804001) 国家自然科学基金(61672058,61876196)资助
关键词 自动ICD编码 融合条目词嵌入 关键词注意力 词语注意力 病案首页 主要诊断 attention word attention medical record home page main diagnosis
  • 相关文献

参考文献1

共引文献8

同被引文献40

引证文献8

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部