-
题名基于电子病历的冠心病亚型危险因素分层抽取
被引量:1
- 1
-
-
作者
余光雷
张琳琳
张颖
李昕遥
毕雪华
-
机构
新疆医科大学医学工程技术学院
新疆大学信息科学与工程学院
新疆医科大学第一附属医院
-
出处
《中国数字医学》
2022年第3期39-44,共6页
-
基金
新疆维吾尔自治区自然科学基金项目(2019D01C205,2019D01C041)。
-
文摘
目的:分析电子病历中的患者特征,实现冠心病患者亚型下危险因素的分层抽取。方法:提出改进的Labeled LDA模型,以多项分布生成冠心病亚型类别标签,然后从亚型类别标签生成危险因素分层这一隐含主题,构建冠心病亚型—患者—危险因素分层—患者特征的4层结构主题模型。该模型通过建立亚型类别标签与危险因素分层之间的映射关系,首先对冠心病亚型进行多分类预测,然后实现患者危险因素在不同亚型下的分层自动抽取。结果:使用真实临床环境采集的电子病历数据进行验证,准确率达到了83.23%,Macro-F1值达到了82.31%。结论:实验结果表明,通过约束患者亚型类别与危险因素分层隐含主题之间的映射,改进的Labele LDA模型具有较高的模型可解释性,且准确率均高于逻辑回归、支持向量机、随机森林和LightGBM等4种对比模型。
-
关键词
labeled
lda
分层抽取
危险因素
冠心病
-
Keywords
labeled lda
Hierarchical extraction
Risk factors
Coronary heart disease
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
R319
[医药卫生—基础医学]
-
-
题名基于主题模型的文献引用贡献分析
被引量:5
- 2
-
-
作者
张金松
陈燕
刘晓钟
-
机构
大连海事大学交通运输管理学院
美国印第安纳大学布鲁明顿分校
-
出处
《图书情报工作》
CSSCI
北大核心
2013年第4期120-124,137,共6页
-
文摘
传统引文分析方法中,文献间的相互关系通常由引用关系决定,也就是说,如果文献A引用文献B,则证明B对A有一定的贡献,然而具体的贡献值与引用原因却很难进行界定。采用主题模型的方法,将原著、引文、被引文献看作是主题模型上的概率分布,通过全文抽取的方法,对引用的原因以及引文贡献值进行分析。首先介绍研究背景与研究意义,并对基本概念进行阐述;然后介绍引文抽取方法、利用Labeled-LDA模型建立主题模型方法等;最后通过实验部分建立基于不同主题的文献引用网络图,并利用工具使其可视化表示。
-
关键词
labeled—lda
主题模型
引文分析
全文抽取
-
Keywords
labeled-lda topic model citation analysis full-text extraction
-
分类号
G253
[文化科学—图书馆学]
G353.1
[文化科学—情报学]
-