基于双向记忆传导的ICD自动编码方法

ICD Automatic Encoding Method Based on Bidirectional Memory Conduction

下载PDF

导出

摘要目的基于深度学习技术,探讨国际疾病分类(ICD)自动编码的方法。方法提取50095例来自麻省理工学院下属重症监护医学信息数据集信息齐全患者的诊断报告和诊断编码,实现一种基于双向记忆传导机制的注意力卷积神经网络,将记忆传导能力引入层级设计的注意力卷积神经网络中。从顺序因果约束和层级关联角度建模,高效捕获诊断文本常见的长序列依赖语境,同时利用层级间特征,提升编码特征重用性。比较本文网络与其他改进网络的性能。结果测试集的平均Macro F1值、Micro F1值、Macro ROC-AUC、Micro ROC-AUC和P@5较其他网络都有所改善,平均预测1名患者的诊断编码只需0.05s。结论经过改进网络设计,能较为准确地实现ICD的自动编码,编码时间相比人工编码大幅缩短,实际应用中可提高编码的工作效率,降低人工编码工作量。 Objective This article proposes a deep learning based method to explore the accuracy of automatic encoding for the International Classification of Diseases(ICD).Methods Extract diagnostic reports and diagnostic codes from 50095 patients with complete information from the Massachusetts Institute of Technology’s intensive care medical information datasets,and implement an attention convolution neural network based on bidirectional memory conduction mechanism.Introduce memory conduction ability into the hierarchical design of the attention convolution neural network.Modeling from the perspective of sequential causal constraints and hierarchical correlations,efficiently capturing common long sequence dependent contexts in diagnostic texts,while utilizing inter hierarchical features to enhance the re-usability of coding features.Compare the performance of this network with other improved networks.Results The average Macro F1 value,Micro F1 value,Macro ROC-AUC,Micro ROC-AUC,and P@5 of the test set improved compared to other networks,with an average prediction time of only 0.05s for a patient’s diagnostic code.Conclusion After improving the network design,the automatic encoding of ICD can be achieved more accurately,and the encoding time is significantly shortened compared to manual encoding.In practical applications,the efficiency of encoding can be improved,and the workload of manual encoding can be reduced.

作者宋凡杨鑫王毅余俊蓉 SONG Fan;YANG Xin;WANG Yi;YU Junrong(The First Affiliated Hospital of Sun Yat-sen University,Guangzhou 510080,Guangdong,China)

机构地区中山大学附属第一医院中山大学肿瘤防治中心

出处《中国卫生信息管理杂志》 2023年第6期977-984,996,共9页 Chinese Journal of Health Informatics and Management

基金广东省基础与应用基础研究基金“基于国产医用直线加速器的‘一站式’放射治疗事件学习和警讯上报系统”(项目编号:2021A1515220140)。

关键词编码准确率自动编码深度学习记忆力机制注意力机制 coding accuracy automatic coding deep learning memory mechanism attention mechanism

分类号 R-39 [医药卫生] R319 [医药卫生—基础医学]

引文网络
相关文献

参考文献6

1苏娅,刘杰,黄亚楼.在线医疗文本中的实体识别研究[J].北京大学学报（自然科学版）,2016,52(1):1-9. 被引量：17
2王阳阳,郑西川.基于自注意力机制的CNN-LSTM模型在ICD智能编码系统中的应用研究[J].中国数字医学,2020,15(11):20-24. 被引量：4
3杨鑫,李学妍,张晓婷,宋凡,黄思娟,夏云飞.基于自适应Unet网络的鼻咽癌放疗危及器官自动分割方法[J].南方医科大学学报,2020,40(11):1579-1586. 被引量：15
4柯珊红,明平勇.感染科ICD编码和ADRG入组错误案例探讨[J].中国病案,2021,22(6):25-27. 被引量：1
5刘怡,郑旭东,张季.黑龙江省某三甲医院住院病案首页ICD编码质量分析[J].中国病案,2020,21(10):18-21. 被引量：14
6李强,尤心心,周佳雯,杨雪,崔好胜,刘喜恩,吴及.基于人工智能的病案首页智能编码技术研究与应用[J].中国数字医学,2022,17(10):59-63. 被引量：5

二级参考文献49

1黄丹.网络医疗对医疗服务理念的挑战[J].中药研究与信息,2005,7(9):31-32. 被引量：4
2Grishman R, Sundheim B. Message Understanding Conference-6: a.brief history // COLING. Copen- hagen, 1996, 96:466-471.
3Doddington G R, Mitchell A, Przybocki M A, et al. The automatic content extraction (ACE) program- tasks, data, and evaluation // LREC. Lisbon, 2004: 837-840.
4DiSantostefano J. International classification of diseases 10th revision (ICD-10). The Journal for Nurse Practitioners, 2009, 5(1): 56-57.
5Lindberg D A, Humphreys B L, McCray A T. The unified medical language system. Methods of Infor- mation in Medicine, 1993, 32(4): 281-291.
6McDonald C J, Overhage J M, Tierney W M, et al. The regenstrief medical record system: a quarter century experience. International Journal of Medical Informatics, 1999, 54(3): 225-253.
7Kraus S, Blake C, West S L. Information extraction from medical notes //Medinfo 2007. Brisbane, 2007: 1-2.
8Sondhi P, Gupta M, Zhai C X, et al. Shallow information extraction from medical forum data // Proceedings of the 23rd International Conference on Computational Linguistics: Posters. Association for Computational Linguistics. Beijing, 2010:1158-1166.
9Luhn H E The automatic creation of literature abstracts. IBM Journal of Research and Development, 1958, 2(2): 159-165.
10Lafferty J, McCallum A, Pereira F C N. Conditional random fields: probabilistic models for segmenting and labeling sequence data//ICML'01 Proceedings of the Eighteenth International Conference on Machine Learning. San Francisco, 2001:282-289.

共引文献49

1文晓博,赵彪,袁美芳,孙梦真,李进芝,杨毅.利用GDL残差U-net模型分割放疗定位CT图像上甲状腺的初步研究[J].中国医学计算机成像杂志,2022,28(3):322-328. 被引量：1
2闫笑群,何琰,李春红,黄丽丽.出院病历病案质量监控分析探讨[J].生命科学仪器,2023,21(S01):212-212.
3陈蕾,周莉,徐庆丰,方紫薇,白龙,李巧艺,唐华南,柏森.自适应放疗在鼻咽癌放疗中的研究进展[J].国际生物医学工程杂志,2022,45(5):424-429. 被引量：2
4王一敏,梁治钢.基于免疫遗传算法的抗菌药物数据挖掘[J].计算机系统应用,2017,26(3):156-161. 被引量：6
5翟菊叶,陈春燕,张钰,陈玉娥,刘玉文.基于CRF与规则相结合的中文电子病历命名实体识别研究[J].包头医学院学报,2017,33(11):124-125. 被引量：14
6周海华,曹春萍.基于BLSTM-CRF的领域知识点实体识别技术[J].软件,2019,40(2):1-5.
7陈德鑫,占袁圆,杨兵,谢亚霓.基于CNN-BiLSTM模型的在线医疗实体抽取研究[J].图书情报工作,2019,63(12):105-113. 被引量：16
8关鹏举,曹春萍.基于BLSTM的临床文本实体关系抽取[J].软件,2019,40(5):159-162. 被引量：2
9曹春萍,关鹏举.基于E-CNN和BLSTM-CRF的临床文本命名实体识别[J].计算机应用研究,2019,36(12):3748-3751. 被引量：16
10张明淘,韩普.医疗实体识别研究进展[J].计算机技术与发展,2020,30(4):57-62. 被引量：2

1李肖力,石英,张健,吴明宇.基于改进GRU的电动汽车续驶里程预测[J].武汉理工大学学报,2023,45(1):85-93.
2徐钊,张一童,池程芝,潘震.基于CNN与BiLSTM的退化设备剩余使用寿命预测[J].航空电子技术,2023,54(2):31-38.
3段勇,王勇,张育民,曾海涛,刘擎.RDW对重症监护病房心力衰竭患者院内死亡的预测价值——基于MIMIC-Ⅲ数据库的回顾性研究[J].检验医学,2023,38(10):951-956. 被引量：1
4王小菊,陈瑜.红细胞分布宽度与白蛋白比值对重症患者30d预后的预测价值[J].智慧健康,2023,9(20):118-121.
5叶迎晖,田雨佳,卢光跃,刘英挺.基于能量收集的互惠共生无线电中断性能分析[J].电子与信息学报,2023,45(7):2350-2357. 被引量：3
6李一长.AIGC崛起,品牌营销又该换玩法了[J].国际公关,2023(4):50-51. 被引量：1
7王高洁,李博,席莉,张越,张选国.国际标准化比值与成人脓毒症病死率的关系[J].中国急救医学,2023,43(12):961-969. 被引量：1
8鲁法明,唐梦凡,包云霞,曾庆田,李彦成.目标导向的多线程程序UAF漏洞预测方法[J].软件学报,2023,34(7):3043-3063.
9周波超,孙国强,王超.新工科建设背景下校企合作模式研究与实践探索[J].教育教学论坛,2023(51):5-8. 被引量：4
10王海丽,邱建,原梦,何惠,黄筱竑.乳酸脱氢酶与白蛋白比值联合APACHEⅡ评分对女性生殖系统和乳腺恶性肿瘤重症患者预后的预测价值[J].浙江医学,2023,45(22):2392-2397.

中国卫生信息管理杂志

2023年第6期

浏览历史

内容加载中请稍等...

基于双向记忆传导的ICD自动编码方法

参考文献6

二级参考文献49

共引文献49

相关作者

相关机构

相关主题

浏览历史