近十年来基因组学和蛋白质组学的快速发展为医学生物学的研究提供了前所未有的机遇。一方面,大规模、高通量的基因和蛋白质的测定工作产生了大量有价值的各类数据;而另一方面,因数据标准的缺乏、数据兼容和整合的艰难而妨碍了人们去...近十年来基因组学和蛋白质组学的快速发展为医学生物学的研究提供了前所未有的机遇。一方面,大规模、高通量的基因和蛋白质的测定工作产生了大量有价值的各类数据;而另一方面,因数据标准的缺乏、数据兼容和整合的艰难而妨碍了人们去充分有效地共享数据,进而更好地促进各自领域的发展。生物信息学也因此成为当今生物医学研究发展必不可少的一个手段。本文就美国国家癌症研究所(National Cancer Institute,NCI)以癌症研究为试点所建立的一个生物信息核心框架caCORE(cancer Common Ontologic Reference Environment)作一简短介绍。展开更多
文摘近十年来基因组学和蛋白质组学的快速发展为医学生物学的研究提供了前所未有的机遇。一方面,大规模、高通量的基因和蛋白质的测定工作产生了大量有价值的各类数据;而另一方面,因数据标准的缺乏、数据兼容和整合的艰难而妨碍了人们去充分有效地共享数据,进而更好地促进各自领域的发展。生物信息学也因此成为当今生物医学研究发展必不可少的一个手段。本文就美国国家癌症研究所(National Cancer Institute,NCI)以癌症研究为试点所建立的一个生物信息核心框架caCORE(cancer Common Ontologic Reference Environment)作一简短介绍。
文摘随着分子生物信息数据量高速增长,生物信息学面临着大规模、高通量、密集型计算的巨大挑战。为有效利用计算机资源,缩短高通量生物信息计算程序执行时间,我们基于Globus Toolkit网格中间件,实现了一个支持高通量生物数据计算的网格系统(Biological Data Computing Grid,简称BDCGrid)。BDCGrid计算网格系统模型可以有效整合中小型生物信息学实验室计算机资源,大大缩短高通量生物信息计算程序执行时间,为相关研究人员利用现有计算机资源处理大规模、高通量生物信息计算任务提供一种新的途径。