期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于融合多策略对比学习的中文医疗术语标准化研究
1
作者
岳崇浩
张剑
+4 位作者
吴义熔
李小龙
华晟
童顺航
孙水发
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第6期144-157,共14页
【目的】应对中文医疗术语标准化存在的短文本、相似性高、单蕴含与多蕴含等挑战,研究基于融合多策略对比学习的召回-排序-数量预测研究框架。【方法】首先,融合文本统计特征和深度语义特征进行候选召回,依据相似度分数获取候选实体集;...
【目的】应对中文医疗术语标准化存在的短文本、相似性高、单蕴含与多蕴含等挑战,研究基于融合多策略对比学习的召回-排序-数量预测研究框架。【方法】首先,融合文本统计特征和深度语义特征进行候选召回,依据相似度分数获取候选实体集;其次,候选排序将原始术语、标准实体、来自候选召回的候选实体结合预训练模型与对比学习策略训练向量表示,依据余弦相似度重新排序;再次,数量预测通过多头注意力更新原始词的向量表示,预测原始术语中蕴含标准实体的数量;最后,融合候选召回和候选排序的相似度分数,基于数量预测结果按照顺序选取对应标准实体。【结果】在中文医疗术语标准化数据集Yidu-N7k上进行性能评估,与统计模型、主流深度学习模型进行比较,融合多策略对比学习的标准化框架的准确率达到92.17%,对比基于预训练的二分类基线模型最多提高0.94个百分点。同时,在自制的150例女性乳腺癌钼靶检查报告数据集上,融合多策略对比学习的标准化框架的准确率达到97.85%,性能最优。【局限】实验只在医疗数据集上展开,在其他领域的有效性需进一步研究。【结论】多策略的候选召回可以全面地考虑文本信息能够应对短文本挑战;对比学习的候选排序能够捕捉文本细微差距能够应对相似性高挑战;多头注意力的数量预测能够增强向量表示能够应对单蕴含与多蕴含挑战。融合多策略对比学习的中文医疗术语标准化方法为促进医学信息挖掘和临床研究提供了潜力。
展开更多
关键词
医疗术语标准化
多策略候选召回
对比学习
乳腺癌钼靶
检查报告
原文传递
题名
基于融合多策略对比学习的中文医疗术语标准化研究
1
作者
岳崇浩
张剑
吴义熔
李小龙
华晟
童顺航
孙水发
机构
智慧医疗宜昌市重点实验室
三峡大学计算机与信息学院
杭州师范大学信息科学与技术学院
三峡大学经济与管理学院
出处
《数据分析与知识发现》
EI
CSCD
北大核心
2024年第6期144-157,共14页
基金
国家社会科学基金项目(项目编号:20BTQ066)的研究成果之一。
文摘
【目的】应对中文医疗术语标准化存在的短文本、相似性高、单蕴含与多蕴含等挑战,研究基于融合多策略对比学习的召回-排序-数量预测研究框架。【方法】首先,融合文本统计特征和深度语义特征进行候选召回,依据相似度分数获取候选实体集;其次,候选排序将原始术语、标准实体、来自候选召回的候选实体结合预训练模型与对比学习策略训练向量表示,依据余弦相似度重新排序;再次,数量预测通过多头注意力更新原始词的向量表示,预测原始术语中蕴含标准实体的数量;最后,融合候选召回和候选排序的相似度分数,基于数量预测结果按照顺序选取对应标准实体。【结果】在中文医疗术语标准化数据集Yidu-N7k上进行性能评估,与统计模型、主流深度学习模型进行比较,融合多策略对比学习的标准化框架的准确率达到92.17%,对比基于预训练的二分类基线模型最多提高0.94个百分点。同时,在自制的150例女性乳腺癌钼靶检查报告数据集上,融合多策略对比学习的标准化框架的准确率达到97.85%,性能最优。【局限】实验只在医疗数据集上展开,在其他领域的有效性需进一步研究。【结论】多策略的候选召回可以全面地考虑文本信息能够应对短文本挑战;对比学习的候选排序能够捕捉文本细微差距能够应对相似性高挑战;多头注意力的数量预测能够增强向量表示能够应对单蕴含与多蕴含挑战。融合多策略对比学习的中文医疗术语标准化方法为促进医学信息挖掘和临床研究提供了潜力。
关键词
医疗术语标准化
多策略候选召回
对比学习
乳腺癌钼靶
检查报告
Keywords
Medical Terminology Normalization
Multi-Strategy Candidate Recall
Contrastive Learning
Breast Cancer Mammography
Examination Report
分类号
TP393 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于融合多策略对比学习的中文医疗术语标准化研究
岳崇浩
张剑
吴义熔
李小龙
华晟
童顺航
孙水发
《数据分析与知识发现》
EI
CSCD
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部