期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向真实世界的知识挖掘与知识图谱补全研究(四):真实世界数据标注平台搭建及基于预训练语言模型的自动化抽取方法探索
1
作者 阎思宇 谭杰骏 +8 位作者 朱海锋 黄桥 王诗淳 马文昊 石涵予 王永博 任相颖 胡文斌 靳英辉 《医学新知》 CAS 2024年第11期1276-1283,共8页
目的探索搭建真实世界数据标注平台,并比较检索增强生成式技术(retrieval augmented generation,RAG)结合大语言模型,及预训练语言模型的预训练-微调方法的真实世界数据提取效果。方法以真实世界电子病历数据中的膀胱癌病理记录为例,搭... 目的探索搭建真实世界数据标注平台,并比较检索增强生成式技术(retrieval augmented generation,RAG)结合大语言模型,及预训练语言模型的预训练-微调方法的真实世界数据提取效果。方法以真实世界电子病历数据中的膀胱癌病理记录为例,搭建真实世界数据标注平台,并基于平台标注数据比较RAG结合GPT-3.5,及基于BERT、RoBERTa模型的预训练-微调方法自动化抽取膀胱癌癌症分型、分期的效果。结果全训练集微调的预训练-微调模型抽取效果优于RAG结合大模型的方法与小样本微调的预训练-微调模型,RoBERTa模型效果总体优于BRET模型,但这些方法的抽取效果均有待提升。在测试集中,使用全训练集微调的RoBERTa模型抽取膀胱癌分型、T分期、N分期的F1值分别为71.06%、50.18%,73.65%。结论预训练语言模型在处理临床非结构化数据方面具有应用潜力,但现有方法在信息抽取效果上仍有提升空间。未来工作需进一步优化模型或训练策略,以加速数据赋能。 展开更多
关键词 真实世界数据 电子病历 标注平台 预训练语言模型 检索增强生成 大语言模型 病理记录 膀胱癌
下载PDF
面向真实世界的知识挖掘与知识图谱补全研究(二):非结构化电子病历信息抽取方法及进展 被引量:4
2
作者 阎思宇 李绪辉 +8 位作者 陈沐坤 朱海锋 谭杰骏 高旷 王永博 黄桥 任相颖 靳英辉 王行环 《医学新知》 CAS 2023年第5期358-365,共8页
随着信息技术的普及和推广,健康医疗大数据呈指数级增长,基于健康医疗大数据的临床真实世界研究日益受到关注。医院电子病历记录了真实世界下患者的诊疗全过程,是最能为临床决策提供支持的数据源之一。但电子病历数据中大量非结构化文... 随着信息技术的普及和推广,健康医疗大数据呈指数级增长,基于健康医疗大数据的临床真实世界研究日益受到关注。医院电子病历记录了真实世界下患者的诊疗全过程,是最能为临床决策提供支持的数据源之一。但电子病历数据中大量非结构化文本数据的存在,增加了数据处理难度,制约了基于电子病历数据研究的开展。急需将信息技术、人工智能等先进的方法用于非结构化电子病历数据的处理,以加速数据价值转化。本文总结了当前非结构化医学数据处理的常用方法,包括基于词典和规则的方法、基于传统机器学习和深度学习的方法和以本体为代表的基于认知模型的方法,探讨了非结构化电子病历数据处理时的标准化问题及透明化报告问题,展望了相关发展。 展开更多
关键词 非结构化数据 电子病历 信息抽取 文本挖掘 自然语言处理 本体 真实世界数据
下载PDF
面向真实世界的知识挖掘与知识图谱补全研究(一):真实世界数据与知识图谱概述 被引量:3
3
作者 李绪辉 阎思宇 +8 位作者 陈沐坤 朱海锋 谭杰骏 高旷 王永博 黄桥 任相颖 靳英辉 王行环 《医学新知》 CAS 2023年第2期130-135,共6页
来源于真实的医疗环境的真实世界数据能够真实反映患者的健康情况和临床诊疗过程,是重要的知识和证据来源。知识图谱作为一种语义网络,可用于组织、呈现和推理医学知识。真实世界数据与知识图谱结合应用能够更好地对医疗知识进行补充、... 来源于真实的医疗环境的真实世界数据能够真实反映患者的健康情况和临床诊疗过程,是重要的知识和证据来源。知识图谱作为一种语义网络,可用于组织、呈现和推理医学知识。真实世界数据与知识图谱结合应用能够更好地对医疗知识进行补充、展示和利用。目前,利用真实世界数据构建医学知识图谱,或使用真实世界数据对医学知识图谱进行补全是两者结合应用的主要方式。在开展真实世界数据与医学知识图谱结合应用研究时,需注意多学科团队协作、患者隐私保护及数据治理标准化等问题。 展开更多
关键词 真实世界数据 知识图谱 电子病历数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部