-
题名基于扩展MDR方法的生存数据的特征选择
- 1
-
-
作者
田野
侯婧雯
王宗辉
郑睿
李若锦
刘艳
-
机构
哈尔滨医科大学卫生统计学教研室
-
出处
《中国卫生统计》
CSCD
北大核心
2022年第5期663-668,共6页
-
基金
黑龙江自然科学基金(LH2019H005)
国家自然科学基金(82173629)。
-
文摘
目的对比分析Surv-MDR、Cox-MDR、Cox UM-MDR和KM-MDR四种用于识别生存分析中SNP位点交互作用的算法,为寻找影响患者生存时间的交互SNP位点时算法的选择提供理论指导。方法使用R 4.0.5完成四种算法以及模拟实验代码的编写,并使用ggplot2包绘制功效对比图;探索实际数据集上影响患者生存时间的交互SNP位点,并使用survminer包绘制相应的生存曲线。结果在不同最小等位基因频率、遗传度下四种方法的效能不同。Cox-MDR受协变量影响最大;Surv-MDR和KM-MDR功效相近且整体表现最好,且KM-MDR具有更好的稳定性;CoxUM-MDR功效强于Cox-MDR但受删失比例影响最大;在真实数据集上,Cox UM-MDR和Surv-MDR识别出了同一个有意义的一阶交互项,Cox-MDR和KM-MDR未能识别出有意义的交互项。结论当不存在协变量时,CoxUM-MDR、Surv-MDR和KM-MDR功效都明显高于Cox-MDR,不宜选用Cox-MDR;当存在协变量且删失比例不高时,Cox-MDR功效高于其他三种方法,宜选用Cox-MDR;但随着删失比例的增加,宜选用CoxUM-MDR或Surv-MDR。
-
关键词
单核苷酸多态性
多因子降维
生存分析
降维
-
Keywords
SNP
MDR
Survival analysis
Dimensionality reduction
-
分类号
R195.1
[医药卫生—卫生统计学]
-
-
题名癌症基因表达数据的自然启发式特征选择方法
- 2
-
-
作者
侯婧雯
田野
王宗辉
郑睿
李若锦
刘艳
-
机构
哈尔滨医科大学公共卫生学院
-
出处
《中国卫生统计》
CSCD
北大核心
2022年第5期714-716,720,共4页
-
基金
黑龙江省自然科学基金(LH2019H005)
国家自然科学基金(82173629)。
-
文摘
DNA微阵列分类技术是近年来可以有效诊断癌症的重要手段,而随着生物信息学和分子生物学的快速发展,基因表达谱的维度上升呈现出了高冗余和高噪音的特点。在微阵列表达数据中只有少数相关基因在分类中是有意义的,不相关基因通过隐藏相关基因会导致分类准确率降低。因此,选择癌症特征基因的有效方法至关重要。本文总结了目前在癌症基因表达数据领域应用的自然启发式特征选择方法,进一步探讨其未来的发展趋势,增进读者对自然启发式特征选择方法的了解。
-
关键词
启发式算法
特征选择
基因表达数据
高维组学
-
分类号
R195.1
[医药卫生—卫生统计学]
-
-
题名基于BP模型与网络问卷调查的染发风险预测
- 3
-
-
作者
王璐琦
曹敏
王琦
李若锦
张敏
张智博
王玥
-
机构
哈尔滨医科大学公共卫生学院
-
出处
《中国公共卫生管理》
2020年第5期602-605,610,共5页
-
基金
国家自然科学基金项目(81773401)。
-
文摘
目的探讨建立合适的神经网络模型来预测染发后出现不良反应的频率,为大众提供有价值的参考意见。方法通过线上发放调查问卷并回收,剔除个别无效问卷,运用单因素χ~2检验与多因素Logistic回归分析,筛选出有统计学意义的变量作为神经网络模型的输入变量,构建BP神经网络,并得出输入变量的重要性,通过分析ROC曲线下面积来评价模型的预测效果。结果回收问卷339份,其中未染过发的164份(48.38%),染过发的175份(51.62%)。染过发的问卷中有效问卷174份,有效率为99.43%。单因素χ~2检验与多因素Logistic回归分析显示,年龄、职业、首次染发年龄、染发剂质量、个人体质和操作规范等为染发后出现不良反应的主要相关因素(P<0.05);神经网络模型训练集正确百分比为93.2%,测试集正确百分比为98.2%;Y=1、2、3、4的ROC曲线下面积分别为0.998、0.980、0.892和0.993,预测结果符合率高;自变量重要性居于前三位的分别是染发剂质量、操作规范与个人体质。结论 BP神经网络模型可以用于预测个体染发后出现不良反应的频率。
-
关键词
染发风险
不良反应
BP神经网络模型
-
Keywords
risk of hair dyeing
adverse reactions
BP neural network model
-
分类号
R194.7
[医药卫生—卫生事业管理]
R195.4
[医药卫生—卫生统计学]
-