期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
大语言模型领域意图的精准性增强方法
1
作者 任元凯 谢振平 《计算机应用研究》 CSCD 北大核心 2024年第10期2893-2899,共7页
目前通用大语言模型(如GPT)在专业领域问答应用中存在不稳定性和不真实性。针对这一现象,提出了一种在通用大语言模型上耦合领域知识的意图识别精准性增强方法(EIRDK),其中引入了三个具体策略:a)通过领域知识库对GPT输出结果进行打分过... 目前通用大语言模型(如GPT)在专业领域问答应用中存在不稳定性和不真实性。针对这一现象,提出了一种在通用大语言模型上耦合领域知识的意图识别精准性增强方法(EIRDK),其中引入了三个具体策略:a)通过领域知识库对GPT输出结果进行打分过滤;b)训练领域知识词向量模型优化提示语句规范性;c)利用GPT的反馈结果提升领域词向量模型和GPT模型的一致性。实验分析显示,相比于标准的GPT模型,新方法在私有数据集上可以提升25%的意图理解准确性,在CMID数据集上可以提升12%的意图理解准确性。实验结果证明了EIRDK方法的有效性。 展开更多
关键词 大语言模型知识问答 意图精准性增强 领域知识集成 GPT反馈学习
下载PDF
机器学习在肿瘤早期诊断与预后预测中的应用 被引量:6
2
作者 施维 薛均 +7 位作者 潘璀然 任元凯 倪正杰 张远鹏 王理 吴辉群 蒋葵 董建成 《医学信息学杂志》 CAS 2016年第11期10-14,22,共6页
简单介绍机器学习法,综述机器学习在肿瘤早期诊断与预后预测中的应用,重点阐述支持向量机、人工神经网络和深度学习3种机器学习方法在肿瘤诊断与预测中的良好表现。
关键词 机器学习 肿瘤 诊断 预测
下载PDF
对医学专业学生开设生物信息学课程的对策 被引量:3
3
作者 王理 施维 +7 位作者 薛均 潘璀然 任元凯 倪正杰 张远鹏 吴辉群 蒋葵 董建成 《医学信息学杂志》 CAS 2017年第1期90-93,共4页
分析医学生生物信息学教学中存在的问题,提出课程开展的相应对策,包括选择或编制合适的教材、完善教学内容、优化教学模式、提升教师教学能力和专业背景、增加实践课时数和结合案例分析等。
关键词 生物信息学 医学类专业 教学模式
下载PDF
一种知识化中国H7N9公共卫生突发事件的方法
4
作者 任元凯 倪正杰 +3 位作者 顾小琳 张远鹏 董建成 王理 《智慧健康》 2017年第1期13-20,共8页
随着社会的流动性和复杂性的迅速增加,从医学领域到公共卫生领域,很多突发性事件不仅会造成各种损失还会造成社会动荡。通常,事件文本中包含了大量的知识,从基础概念间的关系,到疾病爆发、流行、逐步消退的过程中蕴含的规律,再到采取的... 随着社会的流动性和复杂性的迅速增加,从医学领域到公共卫生领域,很多突发性事件不仅会造成各种损失还会造成社会动荡。通常,事件文本中包含了大量的知识,从基础概念间的关系,到疾病爆发、流行、逐步消退的过程中蕴含的规律,再到采取的公共卫生疾控措施。经过分析与抽取,建立完备的公共卫生突发事件领域知识,用于消除公共卫生及医学领域的专业术语及相关概念的歧义性。从而,用清楚的领域知识组织结构表现出中国H7N9公共卫生突发事,有益于之后的突发事件处理,预防以及学术研究。 展开更多
关键词 公共卫生 H7N9 领域知识 突发事件
下载PDF
从真实世界数据到临床研究数据的标准转化研究 被引量:10
5
作者 赖俊恺 王斌 +3 位作者 姚晨 任元凯 晋菲斐 王锴 《中国食品药品监管》 2021年第11期39-46,共8页
临床研究中电子病例报告表(eCRF)的数据收集,传统上由临床研究协调员(CRC)阅读电子病历(EMR)数据将相关内容手动录入至电子数据采集(EDC)系统。为了减轻CRC的负担,目前已有研究在探索将EMR源数据经过数据标准化转换直接变为研究数据集... 临床研究中电子病例报告表(eCRF)的数据收集,传统上由临床研究协调员(CRC)阅读电子病历(EMR)数据将相关内容手动录入至电子数据采集(EDC)系统。为了减轻CRC的负担,目前已有研究在探索将EMR源数据经过数据标准化转换直接变为研究数据集的方法。EMR中大量的非结构化文本数据导致了数据提取困难,无法直接用于临床研究。本文首先探讨了国内对于真实世界数据应用于临床研究数据标准化的需求及困难,开发了一种数据标准化方法。本方法可以基于EMR源数据,通过数据标准化的方式自动填充临床数据交换标准协会(CDISC)标准的eCRF,并满足监管部门的数据递交要求。本方法采用了我国常见的数据标准、人工智能领域的自然语言处理技术,以及提升数据质量的创新型数据采集模式。其数据转化过程的核心是根据最简化的数据模型制定文本数据标签指南,提高了使用自然语言处理算法的效率,优化了其与临床数据模型的互操作性,以及辅助提取研究中所需要的标准术语库。 展开更多
关键词 真实世界数据 临床研究源数据采集 数据标准化 电子源数据 符合监管提交标准
下载PDF
XGboost模型对缺血性脑卒中出院后90d内复发再入院风险的预测效果分析 被引量:26
6
作者 许源 马健勇 +3 位作者 葛艳秋 黎敏 任元凯 易应萍 《中华神经医学杂志》 CAS CSCD 北大核心 2018年第8期813-818,共6页
目的评价XGboost模型对缺血性脑卒中出院后90d内复发再入院风险的预测效果,为缺血性脑卒中复发再入院高危人群的早期筛查及预防提供参考依据。方法回顾性收集南昌大学第二附属医院神经内科自2007年1月至2017年7月收治的6070例初发缺血... 目的评价XGboost模型对缺血性脑卒中出院后90d内复发再入院风险的预测效果,为缺血性脑卒中复发再入院高危人群的早期筛查及预防提供参考依据。方法回顾性收集南昌大学第二附属医院神经内科自2007年1月至2017年7月收治的6070例初发缺血性脑卒中患者的临床资料,采用XGboost模型及多因素Logistic回归分析模型筛选出患者出院后90d内复发再入院的影响因素,分析比较两者的受试者工作特征曲线(ROC)及计算敏感度、特异度、约登指数,以评价XGboost模型的预测效果。结果出院后90d内复发再入院的缺血性脑卒中患者共520例,发病率为8.57%。多因素Logistic回归分析显示住院天数(OR=1.016,P=0.000,95%CI:1.008-1.025)、高血压(OR=4.598,P=-0.000,95%CI:3.717-5.687)、肺部感染(OR=1.452,P=-0.025,95%CI:1.048—2.012)、中性粒细胞百分比(OR=1.013,P=-0.006,95%CI:1.004~1.022)、红细胞分布宽度(变异系数)(OR=I.161,P=-0.000,95%CI:1.090~1.237)、碱性磷酸酶(OR=1.003,P=-0.023,95%CI:1.000~1.005)是复发再入院的独立影响因素。XGboost模型显示排名前六位的复发再人院的影响因素分别为高血压(重要度评分32分)、红细胞分布宽度(变异系数)(重要度评分20分)、直接胆红素(重要度评分19分)、住院天数(重要度评分18分)、肺部感染(重要度评分15分)、碱性磷酸酶(重要度评分14分)。ROC曲线分析显示,XGboost模型预测复发再人院的ROC下面积[0.792(95%CI:0.717~0.762)较多因素Logistic回归分析模型[0.739(95%CI:0.764~0.818)]提升了约5个百分点,且模型灵敏度(89.30%)、约登指数(0.444)均明显高于多因素Logistic回归分析模型(77.3%、0.405)。结论XGboost模型对缺血性脑卒中出院后90d内复发再人院的预测效果优于多因素Logistic回归分析模型,可应用于复发再人院的预测和早期诊断,具有一定的临床应用价值。 展开更多
关键词 XGboost模型 多因素Logistic回归分析模型 预测模型 缺血性脑卒中 复发再入院:影响因素
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部