期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
国家基因组科学数据中心:现状及展望
1
作者 陈梅丽 王彦青 +8 位作者 李茹姣 马英克 张思思 张欣 宋述慧 肖景发 赵文明 章张 鲍一明 《中国科学:生命科学》 CSCD 北大核心 2024年第6期1088-1100,共13页
面向我国人口健康和社会可持续发展的重大战略需求,国家基因组科学数据中心(National Genomics Data Center,NGDC)自2019年成立以来,已初步建成具有自主知识产权、安全可控、涵盖领域广的多维组学数据汇交、存储、管理和共享体系,涵盖... 面向我国人口健康和社会可持续发展的重大战略需求,国家基因组科学数据中心(National Genomics Data Center,NGDC)自2019年成立以来,已初步建成具有自主知识产权、安全可控、涵盖领域广的多维组学数据汇交、存储、管理和共享体系,涵盖基础组学数据资源、国家人类遗传资源、重要战略生物资源、生物安全资源以及生物信息分析工具和平台等,为人口健康、公共安全、育种改良、生物多样性等相关研究提供重要资源和参考信息.截至目前,NGDC已存储和管理27.6 PB的数据量,数据编号被Springer Nature,Elsevier,Wiley,Taylor&Francis等全球主要出版集团推荐或认可.尽管NGDC已连续六年被本领域国际权威期刊《核酸研究》称为与美国NCBI、欧洲EBI齐名的国际主要生物数据中心,但与国际一流数据中心仍存在一定差距.展望未来,NGDC将重点聚焦于数据智能审编、数据融合检索、生物大数据云平台、前沿算法工具等,同时在经费争取、人才培养和国际合作方面加大工作力度,建成国际领先的基因组科学数据中心,支撑我国生命与健康科学领域的科技创新发展和自立自强. 展开更多
关键词 基因组 生物信息 大数据 多组学 人类遗传资源 汇交管理 国家基因组科学数据中心 国家生物信息中心
原文传递
基因组科学数据的安全管理与应用 被引量:7
2
作者 李茹姣 张欣 +6 位作者 宋述慧 王彦青 邹东 肖景发 赵文明 章张 鲍一明 《大数据》 2022年第1期37-45,共9页
基因组科学数据是人口健康和国家安全的重要战略资源,存好、管好和用好基因组科学数据具有重要意义。面对我国生物数据大量产出但因存储零散、缺乏系统监管而丢失和流失,以及严重依赖国际生物组学数据库的局面,亟须从国家层面建设我国... 基因组科学数据是人口健康和国家安全的重要战略资源,存好、管好和用好基因组科学数据具有重要意义。面对我国生物数据大量产出但因存储零散、缺乏系统监管而丢失和流失,以及严重依赖国际生物组学数据库的局面,亟须从国家层面建设我国自己的生物大数据管理体系。以国家基因组科学数据中心为例,阐述了基因组科学数据汇交共享体系和标准规范、数据安全管理机制,给出了数据挖掘与应用的典型案例,并从政策机制、基础设施、软件研发、学科建设、人才培养和国际合作等方面提出对策建议。 展开更多
关键词 科学数据 基因组学 汇交共享 数据安全管理 数据应用
下载PDF
充分发挥国家科学数据中心资源优势 为抗疫提供科技支撑
3
作者 高孟绪 石蕾 +3 位作者 徐波 马俊才 鲍一明 周伟 《国际人才交流》 2023年第2期27-29,共3页
三年来,新型冠状病毒引发了一场肆虐全球的疫情危机,直接威胁着全球卫生安全。世界卫生组织于2020年3月11日宣布,新型冠状病毒肺炎(COVID-19)疫情具备“大流行”特征。疫情发生后,中国公共卫生和科研机构与病毒“全速赛跑”,中国定期向... 三年来,新型冠状病毒引发了一场肆虐全球的疫情危机,直接威胁着全球卫生安全。世界卫生组织于2020年3月11日宣布,新型冠状病毒肺炎(COVID-19)疫情具备“大流行”特征。疫情发生后,中国公共卫生和科研机构与病毒“全速赛跑”,中国定期向世界卫生组织、有关国家和地区等及时主动通报疫情信息并共享科研数据。抗击疫情是一场人类社会与病毒的赛跑,科学数据是助力抗击疫情的重要“武器”。 展开更多
关键词 中国公共卫生 疫情信息 科研数据 科研机构 科学数据 世界卫生组织 资源优势 全球卫生
下载PDF
基因组学数据分析方法现状和展望 被引量:2
4
作者 陈梅丽 马英克 +1 位作者 李茹姣 鲍一明 《数据与计算发展前沿》 2020年第2期1-19,共19页
【目的】全面阐述基因组学数据分析方法的现状和未来发展趋势,为精准医学、精准育种、生物安全、生物多样性、分子进化等的相关组学数据分析算法的研究与工具开发提供参考。【结果】基因组学数据分析主要包括基因组、转录组、表观组数... 【目的】全面阐述基因组学数据分析方法的现状和未来发展趋势,为精准医学、精准育种、生物安全、生物多样性、分子进化等的相关组学数据分析算法的研究与工具开发提供参考。【结果】基因组学数据分析主要包括基因组、转录组、表观组数据分析,当前基因组学数据主要面临着海量、多维、异构等挑战。本文详细地阐述了基因组学数据分析算法和工具开发的现状、应用、存在的问题和面临的挑战。【结论】充分利用人工智能、统计模型、知识图谱等先进技术,不断地优化和开发更先进的算法和更鲁棒的模型,使其兼具高容错、高准确、高效、计算资源低耗等优点,匹配海量、多维、异构基因组学大数据分析的需求,是未来基因组学数据分析算法和工具开发的方向。 展开更多
关键词 基因组 转录组 表观组 大数据分析 多源异构数据整合
下载PDF
高通量计算在大规模人群队列基因组数据解析应用中的挑战 被引量:1
5
作者 曾瀞瑶 苑娜 +2 位作者 魏文娟 李根 杜政霖 《数据与计算发展前沿》 2020年第1期117-127,共11页
【目的】为推动精准医学研究的发展,世界各国相继开展大规模人群队列基因组测序计划,通过对数以万计个体进行全基因组测序,构建人群特异的基因组变异图谱。这些海量基因组数据产出,对计算速度和计算通量提出了新的要求,迫切需要速度更... 【目的】为推动精准医学研究的发展,世界各国相继开展大规模人群队列基因组测序计划,通过对数以万计个体进行全基因组测序,构建人群特异的基因组变异图谱。这些海量基因组数据产出,对计算速度和计算通量提出了新的要求,迫切需要速度更快、通量更高的计算平台来处理与解读这些生物序列信息。由于基因组数据自身的特点、数据解析过程的多样性和复杂性,致使在大规模人群基因组变异解析中高通量计算资源的使用效率低、计算速度慢、耗时长,服务器与本地数据交换不便,因此需要针对基因组变异解析进行多方面优化,通过软硬件开发来解决应用中存在的多种问题。本文拟对这些优化方法进行分析和综述。【方法】在高通量计算系统中,系统IO瓶颈问题是基因组变异解析并行化效率低的主要原因,通常采用基于分布式非结构化存储数据库以及对象存储系统,以提升IO的大规模可扩展能力,解决分析流程中存在的IO问题;同时通过基因组数据的高效压缩算法,可减少数据IO和传输压力。为了加快基因组数据解析速度,可在软件上采用神经网络等算法优化基因组解析方法,在硬件上使用FPGA(现场可编程逻辑门阵列)或GPU异构计算,以提高数据处理速度。【结果】综合来看,以上多方面的优化可以大幅提升基因组数据分析中高通量计算的性能,解决基因组数据处理中的存储墙问题,提高高通量计算资源的使用效率,大大减少全基因组变异解析的计算时间。【结论】高通量计算在基因组数据解析应用中存在的多种问题,可通过软硬件开发和优化得以解决,从而显著改进高通量计算在大规模人群队列变异解析应用中的计算效率,促进今后人群队列基因组研究与应用的广泛开展。 展开更多
关键词 高通量计算 IO性能 基因组变异解析 异构加速 数据压缩
下载PDF
生命组学大数据安全管理实践
6
作者 王彦青 陈婷婷 +7 位作者 张思思 朱军伟 陈焕新 肖景发 宋述慧 章张 赵文明 鲍一明 《农业大数据学报》 2024年第3期325-332,共8页
生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National... 生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National Genomics Data Center,NGDC)面向我国人口健康和社会可持续发展的重大战略需求,建立了生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,形成了一系列数据安全管理的制度和措施。本文聚焦于生命组学大数据全生命周期的安全管理问题,探讨生命组学大数据安全管理框架,全面分析在数据汇交、存储、管理、共享全生命周期中涉及的安全管理内容,并总结了NGDC在生命组学大数据安全管理方面的成效。最后,本文展望了生命组学大数据安全管理的发展方向,包括完善数据分级分类制度、提升数据分级安全管理技术和加强数据异地灾备建设,以期实现生命组学大数据的安全管理与可持续发展。 展开更多
关键词 生命组学大数据 数据汇交 数据共享 安全管理
下载PDF
GSA-Human:人类遗传资源数据管理的公共系统 被引量:10
7
作者 张思思 陈旭 +16 位作者 陈婷婷 朱军伟 唐碧霞 王安可 董丽莉 张哲文 孙艳玲 俞彩霞 翟爽 孙玉彬 陈焕新 杜政霖 肖景发 章张 鲍一明 王彦青 赵文明 《遗传》 CAS CSCD 北大核心 2021年第10期988-993,共6页
GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资... GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资源管理条例》数据安全管理策略,提供公开访问和受控访问相结合的数据使用模式。公开访问数据允许用户自由下载与获取;受控访问数据采用申请-审核的模式,即需要通过数据管理委员会(Data Access Committee,DAC)的授权方可获得下载和使用权限。系统自上线以来,截至2021年7月,汇集数据总量已超5.27 PB。 展开更多
关键词 人类遗传资源数据管理系统 组学数据 数据汇交 数据共享
下载PDF
2019新型冠状病毒信息库 被引量:60
8
作者 赵文明 宋述慧 +14 位作者 陈梅丽 邹东 马利娜 马英克 李茹姣 郝丽丽 李翠萍 田东梅 唐碧霞 王彦青 朱军伟 陈焕新 章张 薛勇彪 鲍一明 《遗传》 CAS CSCD 北大核心 2020年第2期212-221,I0007,I0008,共12页
2019年12月在中国武汉开始爆发的新型肺炎已造成全球25个国家/地区的31516人感染、638人死亡(截止2020年2月7日16时),引起该肺炎的病毒被世界卫生组织命名为2019新型冠状病毒(2019-nCoV)。为促进2019-nCoV数据共享应用并及时向全球公众... 2019年12月在中国武汉开始爆发的新型肺炎已造成全球25个国家/地区的31516人感染、638人死亡(截止2020年2月7日16时),引起该肺炎的病毒被世界卫生组织命名为2019新型冠状病毒(2019-nCoV)。为促进2019-nCoV数据共享应用并及时向全球公众提供病毒的相关信息,国家生物信息中心(CNCB)/国家基因组科学数据中心(NGDC)建立了2019新型冠状病毒信息库(2019nCoVR,https://bigd.big.ac.cn/ncov)。该信息库整合了来自德国全球流感病毒数据库、美国国家生物技术信息中心、深圳(国家)基因库、国家微生物科学数据中心及CNCB/NGDC等机构公开发布的2019-nCoV核苷酸和蛋白质序列数据、元信息、学术文献、新闻动态、科普文章等信息,开展了不同冠状病毒株的基因组序列变异分析并提供可视化展示。同时,2019nCoVR无缝对接CNCB/NGDC的相关数据库,提供新测序病毒株系的基因组原始测序数据、组装后序列的在线汇交、管理与共享、国际数据库同步发布等数据服务。本文对2019nCoVR数据汇交、管理、发布及使用等进行全面阐述,以方便用户了解该信息库各项功能及数据状况,为加速开展病毒的分类溯源、变异演化、快速检测、药物研发以及新型肺炎的精准预防与治疗等研究提供重要基础。 展开更多
关键词 冠状病毒数据库 2019新型冠状病毒 国家生物信息中心 国家基因组科学数据中心 基因组数据共享
下载PDF
数据驱动的公共卫生安全 被引量:1
9
作者 李翠萍 吴林寰 +3 位作者 舒畅 鲍一明 马俊才 宋述慧 《科学通报》 EI CAS CSCD 北大核心 2024年第9期1156-1163,共8页
在现代社会中,数据已成为重要的生产要素和国家基础性战略资源,是维护国家生物安全与社会稳定的利器[1].正确处理和利用数据,有助于我们及时、快速、有效地发现和解决问题,进一步维护社会的和谐稳定发展.在公共卫生安全领域,公共卫生安... 在现代社会中,数据已成为重要的生产要素和国家基础性战略资源,是维护国家生物安全与社会稳定的利器[1].正确处理和利用数据,有助于我们及时、快速、有效地发现和解决问题,进一步维护社会的和谐稳定发展.在公共卫生安全领域,公共卫生安全事件成为21世纪人类生存面临的非传统安全威胁之一,特别是新发再发传染病对全球公共卫生和社会经济安全构成严重威胁[2,3]. 展开更多
关键词 公共卫生安全 数据驱动 非传统安全威胁 全球公共卫生 和谐稳定发展 传染病 21世纪 基础性
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部