期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
被引量:
11
1
作者
刘婧茹
宋阳
+3 位作者
贾睿
张翼鹏
罗勇
马敬东
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第10期124-133,共10页
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据...
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据《健康保险可携性与责任法案》(HIPAA)所规定的18项PHI结合实验数据特征确定7个PHI类别及其下包含的15个PHI类型。基于BiLSTM-CRF模型有效地从非结构化的临床记录中识别受保护的健康信息。【结果】对所有实体类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,并对识别错误的标签进行总结分析。【局限】结合语料特征对模型性能的优化有待完善,并且对于自动识别PHI后的临床文本质量未进行评估。【结论】BiLSTM-CRF模型在不需要特征工程的情况下实现了命名实体自动化识别,有利于促进临床信息共享与利用。
展开更多
关键词
中文临床文本
受保护的健康信息
长短期记忆网络
隐私信息
命名实体识别
原文传递
题名
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
被引量:
11
1
作者
刘婧茹
宋阳
贾睿
张翼鹏
罗勇
马敬东
机构
华中科技大学同济医学院医药卫生管理学院
四川省电子病历工程技术研究中心
成都中医药大学公共卫生学院
四川九阵科技股份有限公司
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第10期124-133,共10页
基金
四川省科技计划项目重点研发基金项目“海量健康数据信息挖掘脱敏技术研究及应用”(项目编号:2018GZ0201)的研究成果之一。
文摘
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据《健康保险可携性与责任法案》(HIPAA)所规定的18项PHI结合实验数据特征确定7个PHI类别及其下包含的15个PHI类型。基于BiLSTM-CRF模型有效地从非结构化的临床记录中识别受保护的健康信息。【结果】对所有实体类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,并对识别错误的标签进行总结分析。【局限】结合语料特征对模型性能的优化有待完善,并且对于自动识别PHI后的临床文本质量未进行评估。【结论】BiLSTM-CRF模型在不需要特征工程的情况下实现了命名实体自动化识别,有利于促进临床信息共享与利用。
关键词
中文临床文本
受保护的健康信息
长短期记忆网络
隐私信息
命名实体识别
Keywords
Chinese Clinical Text
Protected Health Information
Long Short-Term Memory
Private Information
Named Entity Recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
刘婧茹
宋阳
贾睿
张翼鹏
罗勇
马敬东
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020
11
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部