2008年Google成立10周年,英国Nature杂志曾出版关于“讨论大数据处理的技术问题和未来挑战”的专辑,最早提出了“Big Data”的概念[1]。随着计算机科学技术和信息工程技术的迅猛发展和普及应用,各行业数据呈爆炸性增长,大数据处理...2008年Google成立10周年,英国Nature杂志曾出版关于“讨论大数据处理的技术问题和未来挑战”的专辑,最早提出了“Big Data”的概念[1]。随着计算机科学技术和信息工程技术的迅猛发展和普及应用,各行业数据呈爆炸性增长,大数据处理的迫切性和重要性已经获得全球学术界、工业界和各国政府的高度关注和重视。2012年3月,美国总统奥巴马签署并发布了“大数据研究发展创新计划”,该计划由美国国家自然科学基金会(National Science Foundation,NSF)、美国国立卫生研究院(National Institutes of Health,NIH)、能源部(Depa-rtment of Energy,DOE)、国防部(Department of Defense,DOD)等6大部门联合投资2亿美元启动。中国的学术界和工业界也在积极赶超世界前沿,广泛开展大数据技术的研究和开发。“十一五”以来,国家科技部973、863计划联合工业和信息化部开展的核高基等科技重大专项、国家自然科学基金等重大科研计划均已将大数据列为重要的研究内容。展开更多
生命与健康多组学数据是生命科学研究和生物医学技术发展的重要基础。然而,我国缺乏生物数据管理和共享平台,不但无法满足国内日益增长的生物医学及相关学科领域的研究发展需求,而且严重制约我国生物大数据整合共享与转化利用。鉴于此,...生命与健康多组学数据是生命科学研究和生物医学技术发展的重要基础。然而,我国缺乏生物数据管理和共享平台,不但无法满足国内日益增长的生物医学及相关学科领域的研究发展需求,而且严重制约我国生物大数据整合共享与转化利用。鉴于此,中国科学院北京基因组研究所于2016年初成立生命与健康大数据中心(BIG Data Center,BIGD),围绕国家人口健康和重要战略生物资源,建立生物大数据管理平台和多组学数据资源体系。本文重点介绍BIGD的生命与健康大数据资源系统,主要包括组学原始数据归档库、基因组数据库、基因组变异数据库、基因表达数据库、甲基化数据库、生物信息工具库和生命科学维基知识库,提供生物大数据汇交、整合与共享服务,为促进我国生命科学数据管理、推动国家生物信息中心建设奠定重要基础。展开更多
文摘2008年Google成立10周年,英国Nature杂志曾出版关于“讨论大数据处理的技术问题和未来挑战”的专辑,最早提出了“Big Data”的概念[1]。随着计算机科学技术和信息工程技术的迅猛发展和普及应用,各行业数据呈爆炸性增长,大数据处理的迫切性和重要性已经获得全球学术界、工业界和各国政府的高度关注和重视。2012年3月,美国总统奥巴马签署并发布了“大数据研究发展创新计划”,该计划由美国国家自然科学基金会(National Science Foundation,NSF)、美国国立卫生研究院(National Institutes of Health,NIH)、能源部(Depa-rtment of Energy,DOE)、国防部(Department of Defense,DOD)等6大部门联合投资2亿美元启动。中国的学术界和工业界也在积极赶超世界前沿,广泛开展大数据技术的研究和开发。“十一五”以来,国家科技部973、863计划联合工业和信息化部开展的核高基等科技重大专项、国家自然科学基金等重大科研计划均已将大数据列为重要的研究内容。
文摘生命与健康多组学数据是生命科学研究和生物医学技术发展的重要基础。然而,我国缺乏生物数据管理和共享平台,不但无法满足国内日益增长的生物医学及相关学科领域的研究发展需求,而且严重制约我国生物大数据整合共享与转化利用。鉴于此,中国科学院北京基因组研究所于2016年初成立生命与健康大数据中心(BIG Data Center,BIGD),围绕国家人口健康和重要战略生物资源,建立生物大数据管理平台和多组学数据资源体系。本文重点介绍BIGD的生命与健康大数据资源系统,主要包括组学原始数据归档库、基因组数据库、基因组变异数据库、基因表达数据库、甲基化数据库、生物信息工具库和生命科学维基知识库,提供生物大数据汇交、整合与共享服务,为促进我国生命科学数据管理、推动国家生物信息中心建设奠定重要基础。