目的本研究旨在筛选出能够区分早发型与晚发型子痫前期的遗传标志物,并评估这些标志物的区分能力。方法从GEO数据库获取早发型及晚发型子痫前期数据集(GSE74341、GSE190639及GSE4707数据集),以GSE74341和GSE190639数据集为实验组,GSE470...目的本研究旨在筛选出能够区分早发型与晚发型子痫前期的遗传标志物,并评估这些标志物的区分能力。方法从GEO数据库获取早发型及晚发型子痫前期数据集(GSE74341、GSE190639及GSE4707数据集),以GSE74341和GSE190639数据集为实验组,GSE4707数据集为验证组,筛选并验证早发型子痫前期与晚发型子痫前期间的差异表达基因。应用最小绝对值收缩与选择算子(least absolute shrinkage and selection operator,LASSO)及支持向量机-递归特征消除(support vector machines-recursive feature elimination,SVM-RFE)两种机器学习方法筛选特征遗传标志物,并通过受试者工作特征(receiver operating characteristic,ROC)曲线评估特征遗传标志物的区分能力。结果与早发型子痫前期相比,检出7个显著上调基因和3个显著下调基因。通过两种机器学习的方法及在验证组中进行基因表达差异分析,共同筛选出1个特征遗传标志物(MME)。ROC曲线的曲线下面积(area under the curve,AUC)在实验组及验证组中分别为0.975(95%CI:0.921~1.000)及1(95%CI:1.000~1.000)。结论MME可能作为区分早-晚发型子痫前期的特征遗传标志物。展开更多
文摘目的本研究旨在筛选出能够区分早发型与晚发型子痫前期的遗传标志物,并评估这些标志物的区分能力。方法从GEO数据库获取早发型及晚发型子痫前期数据集(GSE74341、GSE190639及GSE4707数据集),以GSE74341和GSE190639数据集为实验组,GSE4707数据集为验证组,筛选并验证早发型子痫前期与晚发型子痫前期间的差异表达基因。应用最小绝对值收缩与选择算子(least absolute shrinkage and selection operator,LASSO)及支持向量机-递归特征消除(support vector machines-recursive feature elimination,SVM-RFE)两种机器学习方法筛选特征遗传标志物,并通过受试者工作特征(receiver operating characteristic,ROC)曲线评估特征遗传标志物的区分能力。结果与早发型子痫前期相比,检出7个显著上调基因和3个显著下调基因。通过两种机器学习的方法及在验证组中进行基因表达差异分析,共同筛选出1个特征遗传标志物(MME)。ROC曲线的曲线下面积(area under the curve,AUC)在实验组及验证组中分别为0.975(95%CI:0.921~1.000)及1(95%CI:1.000~1.000)。结论MME可能作为区分早-晚发型子痫前期的特征遗传标志物。