-
题名基于条件提示与序列标注的电子病历关系三元组识别
- 1
-
-
作者
郭宇捷
唐珂轲
付立军
于碧辉
韩振桥
-
机构
中国科学院大学
中国科学院沈阳计算技术研究所
山东大学大数据技术与认知智能实验室
-
出处
《计算机系统应用》
2022年第8期338-344,共7页
-
基金
国家社科基金(21BTQ106)。
-
文摘
电子病历是诊疗过程中记录患者健康状况的档案,文本中分布着大量的医学实体,其中蕴含着丰富的医学信息.目前医学领域的关系抽取模型主要是通过关系分类的方法识别两个给定医学实体之间的语义关系.中文电子病历具有实体高密度分布的特点.针对这个问题,本文提出了一种基于条件提示与序列标注的关系三元组识别方法,将关系三元组识别任务转换为序列标注任务.关系三元组中的头实体和关系类型作为条件提示信息,通过序列标注方法识别电子病历文本中与条件提示信息有关联的尾实体.在中文电子病历数据集上的实验证明本文方法能有效识别中文电子病历中的关系三元组.
-
关键词
中文电子病历
关系抽取
条件提示
序列标注
关系三元组
-
Keywords
Chinese electronic medical records
relation extraction
condition hint
sequence labeling
relation triple
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
R197.323
[医药卫生—卫生事业管理]
-
-
题名结合RoBERTa与多策略召回的医学术语标准化
被引量:3
- 2
-
-
作者
韩振桥
付立军
刘俊明
郭宇捷
唐珂轲
梁锐
-
机构
中国科学院沈阳计算技术研究所
中国科学院大学
山东大学大数据技术与认知智能实验室
中康健康科技有限公司
-
出处
《计算机系统应用》
2022年第10期245-253,共9页
-
基金
国家社科基金(21BTQ106)
-
文摘
针对传统的基于模板匹配、人工构建特征、语义匹配等解决术语标准化的方案,往往会存在术语映射准确率不高,难以对齐等问题.本文结合医疗领域的文本中术语口语化、表达多样化的特点,使用了多策略召回和蕴含语义评分排序模块来提升医学术语标准化效果.在多策略召回模块中使用了基于Jaccard相关系数、TF-IDF、历史召回方法进行召回,在蕴含语义评分模块使用了RoBERTa-wwm-ext作为判分语义模型.首次在医学专业人员标注的基于SNOMED CT标准的中文数据集上验证了可用性.实验证明,在医疗知识特征的处理中,本方法能够在医学术语标准化实际应用上达到不错的效果,具有很好的泛化性及实用价值.
-
关键词
术语标准化
知识映射
深度学习
RoBERTa-wwm-ext
SNOMED
CT
-
Keywords
term normalization
knowledge mapping
deep learning
RoBERTa-wwm-ext
systematized nomenclature of medicine-clinical terms(SNOMED CT)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
R-05
[医药卫生]
-