摘要
我们应用TCGA肿瘤转录组数据库联合GEO基因芯片数据库,通过生物信息学手段挖掘影响胰腺癌诊断和预后的关键基因。方法 通过limma包对TCGA肿瘤转录组数据库中胰腺癌数据进行差异分析得到差异表达基因(DEGs),从GEO数据库获取胰腺癌相关基因芯片数据(GSE15471),利用GEO2R在线工具寻找差异表达基因,将二者取交集后得到共同DEGs。对这些共同DEGs使用string在线数据库进行了蛋白——蛋白相互作用网络分析(PPI),通过GEPIA在线数据库对共同DEGs进行生存分析获得了与生存时间相关的基因(P<0.05)。结果 我们从TCGA胰腺癌相关转录组测序数据和GSE15471基因芯片数据中得到74个共同DEGs,包括52个上调基因和22个下调基因。其中DMBT1,MUC5B,AGR2上调倍数多达38倍;此外我们还发现其中MMP1,ANLN,AREG,ECT2,EREG这5个基因与生存时间存在显著相关性。我们通过蛋白质相互作用网络分析发现,这些共同DEGs之间存在相互作用,其中DMBT1,MUC5B,AGR2,MMP1,ANLN,AREG,ECT2,EREG处于网络的核心位置,且MMP1,ANLN,AREG,ECT2,EREG在生存分析中P<0.05。结论 我们推测DMBT1,MUC5B,AGR2可以作为胰腺癌诊断的marker基因,MMP1,ANLN,AREG,ECT2,EREG可作为预后marker基因。
基金
中央高校专项资金项目(31920220112),(31920190107)。