利用生物信息学方法筛选与宫颈癌发生、发展和预后相关的血管生成相关基因(angiogenesis related gene,ARG),并进行相关预后风险模型的构建与验证。首先,从TCGA数据库中检索宫颈癌患者的表达谱和临床特征,并提取差异表达的ARG;其次,采用...利用生物信息学方法筛选与宫颈癌发生、发展和预后相关的血管生成相关基因(angiogenesis related gene,ARG),并进行相关预后风险模型的构建与验证。首先,从TCGA数据库中检索宫颈癌患者的表达谱和临床特征,并提取差异表达的ARG;其次,采用Lasso Cox回归筛选预后ARG,构建相关预后模型;再次,使用GSE52903和GSE44001数据集进行外部验证;最后,利用基因集富集分析(gene set enrichment analysis,GSEA)探讨宫颈癌预后机制。筛选结果显示,共获得15个预后ARG,分别为EFNA1、ITGA5、EPHB4、NRP1、CDH5、PLAU、BMP6、DLL4、JUN、CA9、MMP1、BAIAP2L1、SERPINF1、F2RL1和FGFR2。GSE52903和GSE44001数据集的Kaplan-Meier生存曲线显示,高风险组的总生存期(overall survival,OS)(P=0.005)和无病生存期(disease-free survival,DFS)(P<0.001)显著低于低风险组。受试者操作特征(receiver operating characteristic,ROC)曲线分析结果显示,GSE52903验证集在1年、3年和5年的曲线下面积(area under the curve,AUC)值分别为0.84、0.77和0.73,C-指数为0.72;GSE44001验证集在1年、3年和5年的AUC值分别为0.71、0.72和0.70,C-指数为0.70,说明该模型对患者预后具有很强的预测效能。GSEA分析富集的通路主要涉及DNA复制、细胞外基质(extracellular matrix,ECM)受体相互作用、补体和凝血级联等,这些过程与宫颈癌发生、发展紧密相关。以上结果表明,这15个关键ARG可能是宫颈癌预后潜在的生物标志物。展开更多
文摘利用生物信息学方法筛选与宫颈癌发生、发展和预后相关的血管生成相关基因(angiogenesis related gene,ARG),并进行相关预后风险模型的构建与验证。首先,从TCGA数据库中检索宫颈癌患者的表达谱和临床特征,并提取差异表达的ARG;其次,采用Lasso Cox回归筛选预后ARG,构建相关预后模型;再次,使用GSE52903和GSE44001数据集进行外部验证;最后,利用基因集富集分析(gene set enrichment analysis,GSEA)探讨宫颈癌预后机制。筛选结果显示,共获得15个预后ARG,分别为EFNA1、ITGA5、EPHB4、NRP1、CDH5、PLAU、BMP6、DLL4、JUN、CA9、MMP1、BAIAP2L1、SERPINF1、F2RL1和FGFR2。GSE52903和GSE44001数据集的Kaplan-Meier生存曲线显示,高风险组的总生存期(overall survival,OS)(P=0.005)和无病生存期(disease-free survival,DFS)(P<0.001)显著低于低风险组。受试者操作特征(receiver operating characteristic,ROC)曲线分析结果显示,GSE52903验证集在1年、3年和5年的曲线下面积(area under the curve,AUC)值分别为0.84、0.77和0.73,C-指数为0.72;GSE44001验证集在1年、3年和5年的AUC值分别为0.71、0.72和0.70,C-指数为0.70,说明该模型对患者预后具有很强的预测效能。GSEA分析富集的通路主要涉及DNA复制、细胞外基质(extracellular matrix,ECM)受体相互作用、补体和凝血级联等,这些过程与宫颈癌发生、发展紧密相关。以上结果表明,这15个关键ARG可能是宫颈癌预后潜在的生物标志物。