褐藻胶是广泛存在于褐藻中的一类多糖,降解为褐藻寡糖后能表现出更多的生物活性。从海洋样品中筛选出产褐藻胶裂解酶芽胞细菌16株,基于形态、生理生化特征和16S r DNA系统发育分析初步鉴定菌株HB12274为解淀粉芽胞杆菌植物亚种(Bacillus...褐藻胶是广泛存在于褐藻中的一类多糖,降解为褐藻寡糖后能表现出更多的生物活性。从海洋样品中筛选出产褐藻胶裂解酶芽胞细菌16株,基于形态、生理生化特征和16S r DNA系统发育分析初步鉴定菌株HB12274为解淀粉芽胞杆菌植物亚种(Bacillus amyloliquefaciens subsp. plantarum)。TLC结果显示,海藻酸钠经粗酶液降解形成2~7聚合度的褐藻寡糖和单糖,菌株与马尾藻叶片共培养时能明显降解叶状体结构。为褐藻胶裂解酶的生产和工业应用提供了新的菌株来源。展开更多
目的:应用支持向量机(support vector machine,SVM)构建ICU中急性肾功能损伤(acute kidney injury,AKI)患者住院死亡风险预测模型,并比较其与ICU中常用的简化急性生理评分(the simplified acute physiology scoreⅡ,SAPS-Ⅱ)的预测性能...目的:应用支持向量机(support vector machine,SVM)构建ICU中急性肾功能损伤(acute kidney injury,AKI)患者住院死亡风险预测模型,并比较其与ICU中常用的简化急性生理评分(the simplified acute physiology scoreⅡ,SAPS-Ⅱ)的预测性能。方法:使用重症监护医学信息市场(medical information mart for intensive careⅢ,MIMIC-Ⅲ)数据库作为数据来源。根据2012年国际改善全球肾脏病预后组织(Kidney Disease:Improving Global Outcomes,KDIGO)发表的《急性肾损伤临床实践指南》选取MIMIC-Ⅲ数据库中的AKI患者,使用SAPS-Ⅱ中所用到的全部变量构建SVM模型,同时,使用MIMIC-Ⅲ数据库定制本地化的SAPS-Ⅱ模型,并比较其与SVM模型的性能优劣。模型性能的评价方法使用五折交叉验证,评价指标使用受试者工作特征曲线下面积(area under the receiver operation characteristic curve,AUROC)、均方根误差(root mean squared error,RMSE)、灵敏度、特异度和准确率。此外,使用Bland-Altman图评估两模型预测结果的一致性。结果:共纳入19 044例AKI患者,死亡率为13.58%。五折交叉验证的结果显示,SVM模型和定制版SAPS-Ⅱ模型的平均AUROC分别为0.86和0.81,差异有统计学意义(t=13.0,P<0.001),SVM模型和定制版SAPS-Ⅱ模型的平均RMSE分别为0.29和0.31,差异有统计学意义(t=-9.6,P<0.001)。在灵敏度和约登指数方面,SVM模型也均优于定制版的SAPS-Ⅱ模型,差异均具有统计学意义(P分别为0.002和<0.001)。Bland-Altman图显示当患者死亡风险极高或者极低时,两模型预测结果的一致性较好。当患者死亡风险的不确定性较大时,两模型预测结果的一致性较差。结论:相比于传统的SAPS-Ⅱ模型,SVM模型的预测性能更优,且当患者的死亡风险不确定时,这种优势尤其明显;SVM模型更有利于AKI患者的死亡风险识别与早期干预,能有效地帮助ICU临床医生提高医疗质量,有很强的临床应用价值。展开更多
目的:基于集成学习算法建立患者再入重症监护病房(intensive care unit,ICU)的风险预测模型,并比较各个模型的预测性能。方法:使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患...目的:基于集成学习算法建立患者再入重症监护病房(intensive care unit,ICU)的风险预测模型,并比较各个模型的预测性能。方法:使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患者,提取人口学特征、生命体征、实验室检查、合并症等可能对结局有预测作用的变量,基于集成学习方法随机森林、自适应提升算法(adaptive boosting,AdaBoost)和梯度提升决策树(gradient boosting decision tree,GBDT)建立再入ICU预测模型,并比较集成学习与Logistic回归的预测性能。使用五折交叉验证后的平均灵敏度、阳性预测值、阴性预测值、假阳性率、假阴性率、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和Brier评分评价模型效果,基于最佳性能模型给出重要性排序前10位的预测变量。结果:所有模型中,GBDT(AUROC=0.858)优于随机森林(AUROC=0.827),略好于AdaBoost(AUROC=0.851)。与Logistic回归(AUROC=0.810)相比,集成学习算法在区分度上均有较大的提升。GBDT算法给出的变量重要性排序中,平均动脉压、收缩压、舒张压、心率、尿量、血肌酐等变量排序靠前,相对而言,再入ICU患者的心血管功能和肾功能更差。结论:基于集成学习算法的患者再入ICU预测模型表现出较好的性能,优于Logistic回归。使用集成学习算法建立的再入ICU风险预测模型可用于识别再入ICU风险高的患者,医务人员可针对高风险患者采取干预措施,改善患者的整体临床结局。展开更多
目的:基于三种机器学习算法——支持向量机(support vector machine,SVM)、分类回归树(classification and regression tree,CART)和随机森林(random forest,RF),构建重症监护室(intensive care unit,ICU)患者的ICU入住时长(length of I...目的:基于三种机器学习算法——支持向量机(support vector machine,SVM)、分类回归树(classification and regression tree,CART)和随机森林(random forest,RF),构建重症监护室(intensive care unit,ICU)患者的ICU入住时长(length of ICU stay,LOS-ICU)分类预测模型,并与传统的定制版简化急性生理功能评分Ⅱ(simplified acute physiology scoreⅡ,SAPS-Ⅱ)模型进行比较。方法:使用美国大型重症医疗数据库(medical information mart for intensive careⅢ,MIMIC-Ⅲ),以ICU患者是否发生超长LOS-ICU(prolonged LOS-ICU,pLOS-ICU)作为结局指标,构建定制版SAPS-Ⅱ、SVM、CART和RF模型,使用递归特征消除法进行特征选择,基于五折交叉验证找出最佳预测模型。模型的预测性能评价指标包括Brier评分、受试者工作特征(receiver operation characteristic,ROC)曲线下面积(area under the ROC curve,AUROC)和估计校准度指数(estimated calibration index,ECI),模型性能指标之间的比较使用双侧t检验。使用本研究中预测性能最好的模型识别出来的各预测变量重要性排序结果,给出重要性排序前五位的预测变量。结果:最终共纳入40200例ICU患者,发生pLOS-ICU的患者23.7%。其中,男性患者57.6%,患者平均年龄为(61.9±16.5)岁。五折交叉验证结果显示,相比于定制版SAPS-Ⅱ模型,三种机器学习模型的预测性能在各个指标上均有明显提升,且差异均具有统计学意义(P<0.01)。其中,RF模型在综合预测性能、区分度与校准度三个方面均表现最优,其Brier评分、AUROC和ECI分别为0.145、0.770和7.259。校准曲线结果显示,在高pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微高估其风险;在低pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微低估其风险。基于性能最优的RF模型识别的对pLOS-ICU预测最重要的五个变量依次为年龄、心率、收缩压、体温和动脉血氧分压与吸入氧分数之比。结论:基于机器学习方法构建ICU患者的pLOS-ICU预测模型相比于传统的定制版SAPS-Ⅱ模型,预测性能均有明显提升,其中,基于RF方法的pLOS-ICU预测模型性能最优,具有很大的临床应用潜力。展开更多
目的利用系统生物学的方法挖掘2型糖尿病遗传易感标志物并阐明关联背后的生物学含义,为后续的疾病精准预测和精准健康管理提供数据支持和保障。方法对来自糖尿病遗传学重复验证和荟萃分析协作组的全基因组关联研究(genome-wide associat...目的利用系统生物学的方法挖掘2型糖尿病遗传易感标志物并阐明关联背后的生物学含义,为后续的疾病精准预测和精准健康管理提供数据支持和保障。方法对来自糖尿病遗传学重复验证和荟萃分析协作组的全基因组关联研究(genome-wide association studies,GWAS)汇总统计量数据进行基因层面的关联分析,并与人类蛋白互作网络整合形成基因网络,使用密集模块搜索的方法对基因网络进行模块划分,使用基因本体富集分析和组织特异性表达分析挖掘模块基因背后的生物学含义。以基因为基础的关联分析使用VEGAS2完成,组织特异性表达分析使用在线工具完成,其余分析在R3.5.0软件包中完成。结果网络分析识别出一组(223个)紧密互作的基因,它们的联合效应与2型糖尿病显著相关。表达谱显示其中部分基因在免疫和神经系统等组织中高表达。基因本体富集分析显示其主要参与了细胞周期停滞、转录调控、胰岛素分泌调节等生物过程。网络拓扑学指标提示,UBC、APP、GRB2、YWHAZ、ESR1、SUMO2、COPS5、SUMO1、CAND1和JUN对网络结构影响较大,可能参与了2型糖尿病发生发展过程中重要的生物学过程。结论在后GWAS时代,运用GWAS与其他组学数据相结合的系统生物学方法,可以辅助识别候选遗传易感标志物,进而助力于2型糖尿病遗传机制的进一步研究。展开更多
文摘目的:应用支持向量机(support vector machine,SVM)构建ICU中急性肾功能损伤(acute kidney injury,AKI)患者住院死亡风险预测模型,并比较其与ICU中常用的简化急性生理评分(the simplified acute physiology scoreⅡ,SAPS-Ⅱ)的预测性能。方法:使用重症监护医学信息市场(medical information mart for intensive careⅢ,MIMIC-Ⅲ)数据库作为数据来源。根据2012年国际改善全球肾脏病预后组织(Kidney Disease:Improving Global Outcomes,KDIGO)发表的《急性肾损伤临床实践指南》选取MIMIC-Ⅲ数据库中的AKI患者,使用SAPS-Ⅱ中所用到的全部变量构建SVM模型,同时,使用MIMIC-Ⅲ数据库定制本地化的SAPS-Ⅱ模型,并比较其与SVM模型的性能优劣。模型性能的评价方法使用五折交叉验证,评价指标使用受试者工作特征曲线下面积(area under the receiver operation characteristic curve,AUROC)、均方根误差(root mean squared error,RMSE)、灵敏度、特异度和准确率。此外,使用Bland-Altman图评估两模型预测结果的一致性。结果:共纳入19 044例AKI患者,死亡率为13.58%。五折交叉验证的结果显示,SVM模型和定制版SAPS-Ⅱ模型的平均AUROC分别为0.86和0.81,差异有统计学意义(t=13.0,P<0.001),SVM模型和定制版SAPS-Ⅱ模型的平均RMSE分别为0.29和0.31,差异有统计学意义(t=-9.6,P<0.001)。在灵敏度和约登指数方面,SVM模型也均优于定制版的SAPS-Ⅱ模型,差异均具有统计学意义(P分别为0.002和<0.001)。Bland-Altman图显示当患者死亡风险极高或者极低时,两模型预测结果的一致性较好。当患者死亡风险的不确定性较大时,两模型预测结果的一致性较差。结论:相比于传统的SAPS-Ⅱ模型,SVM模型的预测性能更优,且当患者的死亡风险不确定时,这种优势尤其明显;SVM模型更有利于AKI患者的死亡风险识别与早期干预,能有效地帮助ICU临床医生提高医疗质量,有很强的临床应用价值。
文摘目的:基于集成学习算法建立患者再入重症监护病房(intensive care unit,ICU)的风险预测模型,并比较各个模型的预测性能。方法:使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患者,提取人口学特征、生命体征、实验室检查、合并症等可能对结局有预测作用的变量,基于集成学习方法随机森林、自适应提升算法(adaptive boosting,AdaBoost)和梯度提升决策树(gradient boosting decision tree,GBDT)建立再入ICU预测模型,并比较集成学习与Logistic回归的预测性能。使用五折交叉验证后的平均灵敏度、阳性预测值、阴性预测值、假阳性率、假阴性率、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和Brier评分评价模型效果,基于最佳性能模型给出重要性排序前10位的预测变量。结果:所有模型中,GBDT(AUROC=0.858)优于随机森林(AUROC=0.827),略好于AdaBoost(AUROC=0.851)。与Logistic回归(AUROC=0.810)相比,集成学习算法在区分度上均有较大的提升。GBDT算法给出的变量重要性排序中,平均动脉压、收缩压、舒张压、心率、尿量、血肌酐等变量排序靠前,相对而言,再入ICU患者的心血管功能和肾功能更差。结论:基于集成学习算法的患者再入ICU预测模型表现出较好的性能,优于Logistic回归。使用集成学习算法建立的再入ICU风险预测模型可用于识别再入ICU风险高的患者,医务人员可针对高风险患者采取干预措施,改善患者的整体临床结局。
文摘目的:基于三种机器学习算法——支持向量机(support vector machine,SVM)、分类回归树(classification and regression tree,CART)和随机森林(random forest,RF),构建重症监护室(intensive care unit,ICU)患者的ICU入住时长(length of ICU stay,LOS-ICU)分类预测模型,并与传统的定制版简化急性生理功能评分Ⅱ(simplified acute physiology scoreⅡ,SAPS-Ⅱ)模型进行比较。方法:使用美国大型重症医疗数据库(medical information mart for intensive careⅢ,MIMIC-Ⅲ),以ICU患者是否发生超长LOS-ICU(prolonged LOS-ICU,pLOS-ICU)作为结局指标,构建定制版SAPS-Ⅱ、SVM、CART和RF模型,使用递归特征消除法进行特征选择,基于五折交叉验证找出最佳预测模型。模型的预测性能评价指标包括Brier评分、受试者工作特征(receiver operation characteristic,ROC)曲线下面积(area under the ROC curve,AUROC)和估计校准度指数(estimated calibration index,ECI),模型性能指标之间的比较使用双侧t检验。使用本研究中预测性能最好的模型识别出来的各预测变量重要性排序结果,给出重要性排序前五位的预测变量。结果:最终共纳入40200例ICU患者,发生pLOS-ICU的患者23.7%。其中,男性患者57.6%,患者平均年龄为(61.9±16.5)岁。五折交叉验证结果显示,相比于定制版SAPS-Ⅱ模型,三种机器学习模型的预测性能在各个指标上均有明显提升,且差异均具有统计学意义(P<0.01)。其中,RF模型在综合预测性能、区分度与校准度三个方面均表现最优,其Brier评分、AUROC和ECI分别为0.145、0.770和7.259。校准曲线结果显示,在高pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微高估其风险;在低pLOS-ICU发生风险的ICU人群中,RF模型倾向于略微低估其风险。基于性能最优的RF模型识别的对pLOS-ICU预测最重要的五个变量依次为年龄、心率、收缩压、体温和动脉血氧分压与吸入氧分数之比。结论:基于机器学习方法构建ICU患者的pLOS-ICU预测模型相比于传统的定制版SAPS-Ⅱ模型,预测性能均有明显提升,其中,基于RF方法的pLOS-ICU预测模型性能最优,具有很大的临床应用潜力。
文摘目的利用系统生物学的方法挖掘2型糖尿病遗传易感标志物并阐明关联背后的生物学含义,为后续的疾病精准预测和精准健康管理提供数据支持和保障。方法对来自糖尿病遗传学重复验证和荟萃分析协作组的全基因组关联研究(genome-wide association studies,GWAS)汇总统计量数据进行基因层面的关联分析,并与人类蛋白互作网络整合形成基因网络,使用密集模块搜索的方法对基因网络进行模块划分,使用基因本体富集分析和组织特异性表达分析挖掘模块基因背后的生物学含义。以基因为基础的关联分析使用VEGAS2完成,组织特异性表达分析使用在线工具完成,其余分析在R3.5.0软件包中完成。结果网络分析识别出一组(223个)紧密互作的基因,它们的联合效应与2型糖尿病显著相关。表达谱显示其中部分基因在免疫和神经系统等组织中高表达。基因本体富集分析显示其主要参与了细胞周期停滞、转录调控、胰岛素分泌调节等生物过程。网络拓扑学指标提示,UBC、APP、GRB2、YWHAZ、ESR1、SUMO2、COPS5、SUMO1、CAND1和JUN对网络结构影响较大,可能参与了2型糖尿病发生发展过程中重要的生物学过程。结论在后GWAS时代,运用GWAS与其他组学数据相结合的系统生物学方法,可以辅助识别候选遗传易感标志物,进而助力于2型糖尿病遗传机制的进一步研究。