TCGA(The Cancer Genome Atlas)即肿瘤基因组图谱计划是一项由美国NCI(National Cancer Institute)和NHGRI(National Human Genome Research Institute)于2006年合作创立、共同监督的项目,是目前为止世界上最大的癌症基因信息数据库。...TCGA(The Cancer Genome Atlas)即肿瘤基因组图谱计划是一项由美国NCI(National Cancer Institute)和NHGRI(National Human Genome Research Institute)于2006年合作创立、共同监督的项目,是目前为止世界上最大的癌症基因信息数据库。该数据库借助于大规模测序为主的基因组分析技术,将目前人类几乎所有癌症的基因组变异与基因表达水平图谱进行绘制,这将为发现肿瘤基因组的改变以及研究其生物学分子机制提供海量的数据。目前,该数据库向科研人员免费开放,提供进行肿瘤相关研究的数据。本文的主旨是对TCGA公开数据的提取方法进行分析,从而对肿瘤学相关科研人员提供帮助。展开更多
随着二代测序技术的快速发展,数据量不断累积,肿瘤学家的目光逐渐由多物种测序转移至高通量测序数据的分析和比对。基因数据分析方法层出不穷,高通量的组学分析手段不断优化和创新,基因数据的挖掘和分析工作正处于飞速发展的时期。以肿...随着二代测序技术的快速发展,数据量不断累积,肿瘤学家的目光逐渐由多物种测序转移至高通量测序数据的分析和比对。基因数据分析方法层出不穷,高通量的组学分析手段不断优化和创新,基因数据的挖掘和分析工作正处于飞速发展的时期。以肿瘤病人样本为核心的数据库The Cancer Genome Atlas (TCGA)由此应运而生,该数据库全方位记录了从临床肿瘤病人样本得到的基因数据如DNA序列、转录本信息、表观遗传学修饰等。本文主要从数据分析方法、TCGA数据库及其应用实例等3个方面详细介绍了肿瘤相关基因数据的深入挖掘和生物信息学分析方法的最新研究进展,以期为研究人员利用大数据发现肿瘤防治相关的新靶点提供借鉴和参考。展开更多
目的:分析BRAF^(V600E)和RAS基因突变在甲状腺乳头状癌(PTC)中的发生情况,研究BRAF^(V600E)和RAS基因突变与PTC各临床病理特征及预后的相关性。方法:通过cBioPortal网站下载整理癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中PT...目的:分析BRAF^(V600E)和RAS基因突变在甲状腺乳头状癌(PTC)中的发生情况,研究BRAF^(V600E)和RAS基因突变与PTC各临床病理特征及预后的相关性。方法:通过cBioPortal网站下载整理癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中PTC的相关信息,选取资料完善的402例PTC样本的基因突变和临床信息进行分析。先单因素分析BRAF^(V600E)和RAS基因突变与临床病理参数的相关性,再对其进行多因素Logistic回归分析。结果:在402例PTC中,BRAF^(V600E)的突变率为48.5%(195/402),RAS基因突变率为10.2%(41/402)。单因素分析显示BRAF^(V600E)突变与患者的年龄、性别无关(P>0.05),与有无淋巴结转移、有无腺外侵犯、分期、复发进展和病理亚型有关(P<0.05);RAS基因突变与患者年龄、性别、分期、复发进展无关(P>0.05),与有无淋巴结转移、有无腺外侵犯和病理亚型有关(P <0.05)。Logistics回归分析显示BRAF^(V600E)基因突变与有无腺外侵犯和PTC的病理亚型有关(P<0.05),RAS基因突变与有无淋巴结转移、有无腺外侵犯和PTC病理亚型有关(P<0.05)。结论:在PTC中,BRAF^(V600E)基因突变率显著高于RAS基因突变率;BRAF^(V600E)和RAS基因突变可作为PTC患者预后的预测因素。展开更多
目的基于生物信息学方法分析肝细胞癌(hepatocellular carcinoma,HCC)自噬相关长链非编码RNA(long noncoding RNA,lncRNA)生物标志物,用于评估HCC的临床预后及指导治疗。方法从TCGA数据库中下载HCC全转录组数据以及对应的临床数据,在人...目的基于生物信息学方法分析肝细胞癌(hepatocellular carcinoma,HCC)自噬相关长链非编码RNA(long noncoding RNA,lncRNA)生物标志物,用于评估HCC的临床预后及指导治疗。方法从TCGA数据库中下载HCC全转录组数据以及对应的临床数据,在人类自噬数据库(http://www.autophagy.lu/)下载自噬相关基因,通过共表达分析找到自噬相关lncRNA。然后,根据K-M分析及Cox分析构建临床预后模型预测HCC患者生存风险及临床相关性分析。最后,针对这些自噬相关lncRNA进行GSEA功能富集分析和临床样本验证。结果共筛选出919条自噬相关lncRNA,其中AC009403.1、AC099850.3、AL365203.2、AL117336.3和AC015908.3具有临床预后价值且能预测HCC患者生存风险。根据构建的风险模型将高表达AC015908.3患者归为低风险患者,AC099850.3,AL117336.3和AL365203.2归为高风险患者,独立预后分析也验证了构建的预后模型能够预后肝癌患者的生存风险。GSEA功能富集分析发现这5条自噬相关lncRNA主要富集在补体凝血级联、脂肪酸代谢、药物代谢与细胞色素P450、视黄醇代谢、氨基酸代谢、嘧啶代谢、剪接体、嘌呤代谢、碱基切除修复和细胞周期等通路。PCR结果显示,相对于正常肝脏组织,AC009403.1(6.36±2.44 vs 12.67±3.58;t=11.21,P<0.001)、AC099850.3(9.48±3.08 vs 16.11±4.52;t=9.45,P<0.001)、AL365203.2(5.89±2.33 vs 13.05±4.19;t=10.45,P<0.001)、AL117336.3(5.44±2.60 vs 16.41±6.90;t=9.28,P<0.001)在HCC组织中高表达,AC015908.3在HCC组织低表达(12.43±4.56 vs 6.03±1.94;t=9.13,P<0.001)。结论5条自噬相关lncRNA构建的风险预测模型能够预测HCC患者的临床预后,且通过生物代谢和细胞增殖等生物学过程参与HCC发生发展。展开更多
目的:研究相关基因在肾透明细胞癌中的表达变化,评价相关基因与肾透明细胞癌的关系及其对预后的影响。方法:在TCGA(The Cancer Genome Atlas)数据库中配对肾透明细胞癌组织和正常肾细胞组织相关基因表达谱数据,通过数据挖掘技术挖掘相...目的:研究相关基因在肾透明细胞癌中的表达变化,评价相关基因与肾透明细胞癌的关系及其对预后的影响。方法:在TCGA(The Cancer Genome Atlas)数据库中配对肾透明细胞癌组织和正常肾细胞组织相关基因表达谱数据,通过数据挖掘技术挖掘相关基因(VHL,PBRM1,TTN,SETD2,BAP1)与肾透明细胞癌表达及预后的关系。结果:相对比正常肾透明细胞组织,VHL,PBRM1,SETD2,BAP1均呈低表达,TTN呈高表达,通过建立相关生存曲线,可知PBRM1低表达与TTN高表达能够减少肾透明细胞癌患者的生存时间,而VHL、SETD2、BAP1基因低表达与肾透明细胞癌患者的生存时间无统计学差异。结论:PBRM1的低表达与TTN高表达是影响肾透明细胞癌预后的不良因素,因此PRBM1、TTN基因的表达对判断肾透明细胞癌患者的生存预后具有参考价值。展开更多
文摘TCGA(The Cancer Genome Atlas)即肿瘤基因组图谱计划是一项由美国NCI(National Cancer Institute)和NHGRI(National Human Genome Research Institute)于2006年合作创立、共同监督的项目,是目前为止世界上最大的癌症基因信息数据库。该数据库借助于大规模测序为主的基因组分析技术,将目前人类几乎所有癌症的基因组变异与基因表达水平图谱进行绘制,这将为发现肿瘤基因组的改变以及研究其生物学分子机制提供海量的数据。目前,该数据库向科研人员免费开放,提供进行肿瘤相关研究的数据。本文的主旨是对TCGA公开数据的提取方法进行分析,从而对肿瘤学相关科研人员提供帮助。
文摘随着二代测序技术的快速发展,数据量不断累积,肿瘤学家的目光逐渐由多物种测序转移至高通量测序数据的分析和比对。基因数据分析方法层出不穷,高通量的组学分析手段不断优化和创新,基因数据的挖掘和分析工作正处于飞速发展的时期。以肿瘤病人样本为核心的数据库The Cancer Genome Atlas (TCGA)由此应运而生,该数据库全方位记录了从临床肿瘤病人样本得到的基因数据如DNA序列、转录本信息、表观遗传学修饰等。本文主要从数据分析方法、TCGA数据库及其应用实例等3个方面详细介绍了肿瘤相关基因数据的深入挖掘和生物信息学分析方法的最新研究进展,以期为研究人员利用大数据发现肿瘤防治相关的新靶点提供借鉴和参考。
文摘目的:分析BRAF^(V600E)和RAS基因突变在甲状腺乳头状癌(PTC)中的发生情况,研究BRAF^(V600E)和RAS基因突变与PTC各临床病理特征及预后的相关性。方法:通过cBioPortal网站下载整理癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中PTC的相关信息,选取资料完善的402例PTC样本的基因突变和临床信息进行分析。先单因素分析BRAF^(V600E)和RAS基因突变与临床病理参数的相关性,再对其进行多因素Logistic回归分析。结果:在402例PTC中,BRAF^(V600E)的突变率为48.5%(195/402),RAS基因突变率为10.2%(41/402)。单因素分析显示BRAF^(V600E)突变与患者的年龄、性别无关(P>0.05),与有无淋巴结转移、有无腺外侵犯、分期、复发进展和病理亚型有关(P<0.05);RAS基因突变与患者年龄、性别、分期、复发进展无关(P>0.05),与有无淋巴结转移、有无腺外侵犯和病理亚型有关(P <0.05)。Logistics回归分析显示BRAF^(V600E)基因突变与有无腺外侵犯和PTC的病理亚型有关(P<0.05),RAS基因突变与有无淋巴结转移、有无腺外侵犯和PTC病理亚型有关(P<0.05)。结论:在PTC中,BRAF^(V600E)基因突变率显著高于RAS基因突变率;BRAF^(V600E)和RAS基因突变可作为PTC患者预后的预测因素。
文摘目的基于生物信息学方法分析肝细胞癌(hepatocellular carcinoma,HCC)自噬相关长链非编码RNA(long noncoding RNA,lncRNA)生物标志物,用于评估HCC的临床预后及指导治疗。方法从TCGA数据库中下载HCC全转录组数据以及对应的临床数据,在人类自噬数据库(http://www.autophagy.lu/)下载自噬相关基因,通过共表达分析找到自噬相关lncRNA。然后,根据K-M分析及Cox分析构建临床预后模型预测HCC患者生存风险及临床相关性分析。最后,针对这些自噬相关lncRNA进行GSEA功能富集分析和临床样本验证。结果共筛选出919条自噬相关lncRNA,其中AC009403.1、AC099850.3、AL365203.2、AL117336.3和AC015908.3具有临床预后价值且能预测HCC患者生存风险。根据构建的风险模型将高表达AC015908.3患者归为低风险患者,AC099850.3,AL117336.3和AL365203.2归为高风险患者,独立预后分析也验证了构建的预后模型能够预后肝癌患者的生存风险。GSEA功能富集分析发现这5条自噬相关lncRNA主要富集在补体凝血级联、脂肪酸代谢、药物代谢与细胞色素P450、视黄醇代谢、氨基酸代谢、嘧啶代谢、剪接体、嘌呤代谢、碱基切除修复和细胞周期等通路。PCR结果显示,相对于正常肝脏组织,AC009403.1(6.36±2.44 vs 12.67±3.58;t=11.21,P<0.001)、AC099850.3(9.48±3.08 vs 16.11±4.52;t=9.45,P<0.001)、AL365203.2(5.89±2.33 vs 13.05±4.19;t=10.45,P<0.001)、AL117336.3(5.44±2.60 vs 16.41±6.90;t=9.28,P<0.001)在HCC组织中高表达,AC015908.3在HCC组织低表达(12.43±4.56 vs 6.03±1.94;t=9.13,P<0.001)。结论5条自噬相关lncRNA构建的风险预测模型能够预测HCC患者的临床预后,且通过生物代谢和细胞增殖等生物学过程参与HCC发生发展。
文摘目的:研究相关基因在肾透明细胞癌中的表达变化,评价相关基因与肾透明细胞癌的关系及其对预后的影响。方法:在TCGA(The Cancer Genome Atlas)数据库中配对肾透明细胞癌组织和正常肾细胞组织相关基因表达谱数据,通过数据挖掘技术挖掘相关基因(VHL,PBRM1,TTN,SETD2,BAP1)与肾透明细胞癌表达及预后的关系。结果:相对比正常肾透明细胞组织,VHL,PBRM1,SETD2,BAP1均呈低表达,TTN呈高表达,通过建立相关生存曲线,可知PBRM1低表达与TTN高表达能够减少肾透明细胞癌患者的生存时间,而VHL、SETD2、BAP1基因低表达与肾透明细胞癌患者的生存时间无统计学差异。结论:PBRM1的低表达与TTN高表达是影响肾透明细胞癌预后的不良因素,因此PRBM1、TTN基因的表达对判断肾透明细胞癌患者的生存预后具有参考价值。