文摘目的探讨子宫内膜癌(EC)患者预后相关差异基因筛选,并构建其预后预测模型。方法在癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov/)中,以“Uteri”“TCGA-UCEC”“transcriptome profiling”“gene expression quantification and HTSeq-FPKM”为关键词,检索EC患者和正常女性受试者的子宫内膜组织RNA-seq微阵列基因表达数据及其相关临床信息。本研究检索时间设定为TCGA数据库建库至2021年1月15日。选择最终符合本研究纳入标准的542例EC患者与35例正常女性受试者为研究对象。本研究基于TCGA数据库的EC差异基因患者的预后预测模型构建步骤为:①利用R语言微阵列数据的线性模型(LIMMA)包,对TCGA数据库的RNA-seq微阵列基因表达数据进行差异基因分析,筛选影响EC发生、发展的候选差异基因。②利用Kaplan-Meier法、LASSO算法回归、单因素Cox比例风险回归分析法,对EC患者生存相关差异基因进行筛选。采用多因素Cox比例风险回归分析法,确定EC患者预后相关差异基因。③构建EC差异基因的EC患者预后预测模型。④利用survival受试者工作特征(ROC)曲线软件包,检测该预测模型的准确性,并绘制列线图。结果①在本组EC患者中,共计发现466个EC差异基因,其中上调基因为179个,下调基因为287个。②在本组EC患者的96个EC生存相关差异基因中,7个为预后相关差异基因,包括孕激素受体(PGR)、sushi重复含蛋白质X连锁(SRPX)、γ-谷氨酰水解酶(GGH)、分泌球蛋白家族2A成员1(SCGB2A1)、胰岛素样生长因子结合蛋白5(IGFBP5)、细胞周期蛋白依赖性激酶抑制剂2A(CDKN2A)、神经调节素U(NMU)基因。对这7个差异基因的单因素Cox比例风险回归分析结果显示,其均为EC患者预后影响因素(P<0.05)。多因素Cox比例风险回归分析结果显示,GGH、IGFBP5、CDKN2A差异基因,均为影响EC患者预后的独立危险因素(P<0.05),若EC患者GGH、IGFBP5、CDKN2A差异基因表达水平越高,则患者预后越差。③建立EC患者总体生存(OS)期预测模型为:ln[h(t,X)/h 0(t)]=1.300 x GGH+1.200 x IGFBP5+1.200 x CDKN2A。其中,h(t,X):受试者在t时刻的风险率函数,h 0(t):受试者在t时刻的基准风险率函数,即x GGH、x IGFBP5、x CDKN2A均为0时的风险率函数,x GGH、x IGFBP5、x CDKN2A分别表示GGH、IGFBP5、CDKN2A差异基因表达水平。④采用上述预测模型,对研究组患者的生存风险进行评分,并按照其中位风险评分,进一步将其分为高危亚组(n=271,风险评分高于中位评分)与低危亚组(n=271,风险评分低于中位评分),并且低危亚组OS期显著长于高危亚组,差异有统计学意义(χ^(2)=33.000,P<0.001),对该模型预测EC患者OS期的ROC曲线分析结果显示,曲线下面积(AUC)为0.700(95%CI:0.673~0.751,P<0.001),同时构建的Nomogram列线图,可定量预测EC患者1、3、5年OS率。结论构建的GGH、IGFBP5和CDKN2A差异基因的EC患者预后预测模型,可为临床预测EC患者预后及寻找相应靶向治疗药物提供数据支持。