-
题名基于层叠条件随机场模型的电子病历文本信息抽取
被引量:10
- 1
-
-
作者
梁立荣
李长伟
沈晔
周立娟
景行
童朝晖
-
机构
首都医科大学附属北京朝阳医院北京市呼吸疾病研究所临床流行病学研究室
乔治亚大学公共卫生学院流行病学与生物统计学系
北京无极慧通科技有限公司
首都医科大学附属北京朝阳医院北京市呼吸疾病研究所呼吸与危重症医学科
-
出处
《计算机应用与软件》
北大核心
2019年第10期47-54,112,共9页
-
基金
北京市第五批高层次卫生技术人才(学科骨干)项目(2015-3-026)
-
文摘
自然语言处理技术已用于非结构化中文电子病历信息抽取,并且新的算法或模型不断出现,但其应用效果的证据较少。共收集北京某大型三甲综合医院呼吸专科住院电子病历38218份,通过对数据预处理,抽象文本特征与定义语法规则,产生训练数据集和测试集,构建层叠条件随机场模型,并评估该模型的识别效果。结果表明,针对入院记录、出院记录、辅助检查报告3大类共39种非结构化文本,该模型可准确、快速地处理病历文本信息,应用效果较为理想。
-
关键词
医疗电子病历
自然语言处理
机器学习
层叠条件随机场模型
信息抽取
-
Keywords
Electronic medical record
Natural language processing
Machine learning
Cascaded conditional random field model
Information extraction
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-