目的利用自适应合成抽样(adaptive synthetic sampling,ADASYN)与类别逆比例加权法处理类别不平衡数据,结合分类器构建模型对阿尔茨海默病(alzheimer′s disease,AD)患者疾病进程进行分类预测。方法数据源自阿尔茨海默病神经影像学计划(...目的利用自适应合成抽样(adaptive synthetic sampling,ADASYN)与类别逆比例加权法处理类别不平衡数据,结合分类器构建模型对阿尔茨海默病(alzheimer′s disease,AD)患者疾病进程进行分类预测。方法数据源自阿尔茨海默病神经影像学计划(Alzheimer′s disease neuroimaging initiative,ADNI),经随机森林填补缺失值,弹性网络筛选特征子集后,利用ADASYN与类别逆比例加权法处理类别不平衡数据。分别结合随机森林(random forest,RF)、支持向量机(support vector machine,SVM)构建四种模型:ADASYN-RF、ADASYN-SVM、加权随机森林(weighted random forest,WRF)、加权支持向量机(weighted support vector machine,WSVM),与RF、SVM比较分类性能。模型评价指标为宏观平均精确率(macro-average of precision,macro-P)、宏观平均召回率(macro-average of recall,macro-R)、宏观平均F1值(macro-average of F1-score,macro-F1)、准确率(accuracy,ACC)、Kappa值和AUC(area under the ROC curve)。结果ADASYN-RF的分类性能最优(Kappa值为0.938,AUC为0.980),ADASYN-SVM次之。利用ADASYN-RF预测得到的重要分类特征分别为CDRSB、LDELTOTAL、MMSE,在临床上均可得到证实。结论ADASYN与类别逆比例加权法都能辅助提升分类器性能,但ADASYN算法更优。展开更多
目的基于传染病动力学SEAIQR(susceptible-exposed-asymptomatic-infected-quarantined-removed)模型和Dropout-LSTM(Dropout long short term memory network)模型预测西安市新型冠状病毒肺炎(COVID-19)疫情的发展趋势,为评估“动态清...目的基于传染病动力学SEAIQR(susceptible-exposed-asymptomatic-infected-quarantined-removed)模型和Dropout-LSTM(Dropout long short term memory network)模型预测西安市新型冠状病毒肺炎(COVID-19)疫情的发展趋势,为评估“动态清零”策略防控效果提供科学依据。方法考虑到西安市本轮疫情存在大量的无症状感染者、依时变化的参数以及采取的管控举措等特点,构建具有阶段性防控措施的时变SEAIQR模型。考虑到COVID-19疫情数据的时序性特征及它们之间的非线性关系,构建深度学习Dropout-LSTM模型。选用2021年12月9日-2022年1月31日西安市新增确诊病例数据进行拟合,用2022年2月1日-2022年2月7日数据评估预测效果,计算有效再生数(R_(t))并评价不同参数对疫情发展的影响。结果SEAIQR模型预测的新增确诊病例拐点预计在2021年12月26日出现,约为176例,疫情将于2022年1月24日实现“动态清零”,模型R^(2)=0.849。Dropout-LSTM模型能够体现数据的时序性与非线性特征,预测出的新增确诊病例数与实际情况高度吻合,R^(2)=0.937。Dropout-LSTM模型的MAE和RMSE均较SEAIQR模型低,说明预测结果更为理想。疫情暴发初期,R 0为5.63,自实施全面管控后,R_(t)呈逐渐下降趋势,直到2021年12月27日降至1.0以下。随着有效接触率不断缩小、管控措施的提早实施及免疫阈值的提高,新增确诊病例在到达拐点时的人数将会持续降低。结论建立的Dropout-LSTM模型实现了较准确的疫情预测,可为COVID-19疫情“动态清零”防控决策提供借鉴。展开更多
文摘目的利用自适应合成抽样(adaptive synthetic sampling,ADASYN)与类别逆比例加权法处理类别不平衡数据,结合分类器构建模型对阿尔茨海默病(alzheimer′s disease,AD)患者疾病进程进行分类预测。方法数据源自阿尔茨海默病神经影像学计划(Alzheimer′s disease neuroimaging initiative,ADNI),经随机森林填补缺失值,弹性网络筛选特征子集后,利用ADASYN与类别逆比例加权法处理类别不平衡数据。分别结合随机森林(random forest,RF)、支持向量机(support vector machine,SVM)构建四种模型:ADASYN-RF、ADASYN-SVM、加权随机森林(weighted random forest,WRF)、加权支持向量机(weighted support vector machine,WSVM),与RF、SVM比较分类性能。模型评价指标为宏观平均精确率(macro-average of precision,macro-P)、宏观平均召回率(macro-average of recall,macro-R)、宏观平均F1值(macro-average of F1-score,macro-F1)、准确率(accuracy,ACC)、Kappa值和AUC(area under the ROC curve)。结果ADASYN-RF的分类性能最优(Kappa值为0.938,AUC为0.980),ADASYN-SVM次之。利用ADASYN-RF预测得到的重要分类特征分别为CDRSB、LDELTOTAL、MMSE,在临床上均可得到证实。结论ADASYN与类别逆比例加权法都能辅助提升分类器性能,但ADASYN算法更优。
文摘目的基于传染病动力学SEAIQR(susceptible-exposed-asymptomatic-infected-quarantined-removed)模型和Dropout-LSTM(Dropout long short term memory network)模型预测西安市新型冠状病毒肺炎(COVID-19)疫情的发展趋势,为评估“动态清零”策略防控效果提供科学依据。方法考虑到西安市本轮疫情存在大量的无症状感染者、依时变化的参数以及采取的管控举措等特点,构建具有阶段性防控措施的时变SEAIQR模型。考虑到COVID-19疫情数据的时序性特征及它们之间的非线性关系,构建深度学习Dropout-LSTM模型。选用2021年12月9日-2022年1月31日西安市新增确诊病例数据进行拟合,用2022年2月1日-2022年2月7日数据评估预测效果,计算有效再生数(R_(t))并评价不同参数对疫情发展的影响。结果SEAIQR模型预测的新增确诊病例拐点预计在2021年12月26日出现,约为176例,疫情将于2022年1月24日实现“动态清零”,模型R^(2)=0.849。Dropout-LSTM模型能够体现数据的时序性与非线性特征,预测出的新增确诊病例数与实际情况高度吻合,R^(2)=0.937。Dropout-LSTM模型的MAE和RMSE均较SEAIQR模型低,说明预测结果更为理想。疫情暴发初期,R 0为5.63,自实施全面管控后,R_(t)呈逐渐下降趋势,直到2021年12月27日降至1.0以下。随着有效接触率不断缩小、管控措施的提早实施及免疫阈值的提高,新增确诊病例在到达拐点时的人数将会持续降低。结论建立的Dropout-LSTM模型实现了较准确的疫情预测,可为COVID-19疫情“动态清零”防控决策提供借鉴。