目的采用美国肿瘤与癌症基因组图谱(Tumor and Cancer Genome Atlas,TCGA)数据库分析肺腺癌的组织与正常人体组织的差异基因,寻找与肺腺癌发病相关的关键基因,为临床早期诊断肺腺癌提供参考。方法在R语言环境下,用limma包处理从TCGA数...目的采用美国肿瘤与癌症基因组图谱(Tumor and Cancer Genome Atlas,TCGA)数据库分析肺腺癌的组织与正常人体组织的差异基因,寻找与肺腺癌发病相关的关键基因,为临床早期诊断肺腺癌提供参考。方法在R语言环境下,用limma包处理从TCGA数据库下载的肺腺癌mRNA转录组数据与临床数据,其中mRNA转录组数据包含正常组织59例,肺腺癌组织535例,共594例样本。对数据进行差异表达分析,筛选log 2FC排名前200位的基因,并对其进行GO和KEGG富集分析。对FDR值排序,选取排名前200位的mRNA差异基因并构建蛋白互作网络图。将网络节点降序排列并寻找关键基因,以关键基因中位值为界将其分为低表达组与高表达组,并进行生存分析。将生存分析中差异有统计学意义的关键基因根据Stage分期进行分组,并进行差异分析以明确关键基因在临床早期与随疾病分期进展的表达情况。结果筛选出5526个差异表达基因。GO富集分析结果表明,其生物过程主要在多细胞生物过程等功能富集。KEGG富集分析结果则显示,其生物过程主要在神经活性配体-受体相互作用等方面发挥作用。筛选出ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8等前30位关键基因,进一步分析显示,ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8高、低表达组生存率比较,差异有统计学意义(P<0.05),其余25个基因生存率差异无统计学意义(P>0.05)。关键基因不同Stage分期的基因表达量差异分析显示,ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8中只有ADAMTS8各分期表达量差异有统计学意义(P<0.05)。结论通过TCGA数据库分析出ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8在肺腺癌患者临床早期就已有表达,有望成为早期诊断肺腺癌的基因。展开更多
文摘目的采用美国肿瘤与癌症基因组图谱(Tumor and Cancer Genome Atlas,TCGA)数据库分析肺腺癌的组织与正常人体组织的差异基因,寻找与肺腺癌发病相关的关键基因,为临床早期诊断肺腺癌提供参考。方法在R语言环境下,用limma包处理从TCGA数据库下载的肺腺癌mRNA转录组数据与临床数据,其中mRNA转录组数据包含正常组织59例,肺腺癌组织535例,共594例样本。对数据进行差异表达分析,筛选log 2FC排名前200位的基因,并对其进行GO和KEGG富集分析。对FDR值排序,选取排名前200位的mRNA差异基因并构建蛋白互作网络图。将网络节点降序排列并寻找关键基因,以关键基因中位值为界将其分为低表达组与高表达组,并进行生存分析。将生存分析中差异有统计学意义的关键基因根据Stage分期进行分组,并进行差异分析以明确关键基因在临床早期与随疾病分期进展的表达情况。结果筛选出5526个差异表达基因。GO富集分析结果表明,其生物过程主要在多细胞生物过程等功能富集。KEGG富集分析结果则显示,其生物过程主要在神经活性配体-受体相互作用等方面发挥作用。筛选出ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8等前30位关键基因,进一步分析显示,ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8高、低表达组生存率比较,差异有统计学意义(P<0.05),其余25个基因生存率差异无统计学意义(P>0.05)。关键基因不同Stage分期的基因表达量差异分析显示,ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8中只有ADAMTS8各分期表达量差异有统计学意义(P<0.05)。结论通过TCGA数据库分析出ADRB2、GIMAP8、LMO2、TNS1、ADAMTS8在肺腺癌患者临床早期就已有表达,有望成为早期诊断肺腺癌的基因。