期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
生命组学大数据安全管理实践
1
作者 王彦青 陈婷婷 +7 位作者 张思思 朱军伟 陈焕新 肖景发 宋述慧 章张 赵文明 鲍一明 《农业大数据学报》 2024年第3期325-332,共8页
生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National... 生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National Genomics Data Center,NGDC)面向我国人口健康和社会可持续发展的重大战略需求,建立了生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,形成了一系列数据安全管理的制度和措施。本文聚焦于生命组学大数据全生命周期的安全管理问题,探讨生命组学大数据安全管理框架,全面分析在数据汇交、存储、管理、共享全生命周期中涉及的安全管理内容,并总结了NGDC在生命组学大数据安全管理方面的成效。最后,本文展望了生命组学大数据安全管理的发展方向,包括完善数据分级分类制度、提升数据分级安全管理技术和加强数据异地灾备建设,以期实现生命组学大数据的安全管理与可持续发展。 展开更多
关键词 生命组学大数据 数据汇交 数据共享 安全管理
下载PDF
二肽肽酶IV抑制剂的三维定量构效关系研究 被引量:2
2
作者 肖景发 郭宗儒 +2 位作者 郭彦伸 褚凤鸣 孙飘扬 《化学学报》 SCIE CAS CSCD 北大核心 2005年第8期757-763,共7页
二肽肽酶IV是一类用于治疗II型糖尿病具有潜在价值的关键酶, 很多此类酶的抑制剂用于处理此病具有相当好的有效性. 一系列N-取代的甘氨酰氰基吡咯烷衍生物对于二肽肽酶具有高的活性和选择性. 我们使用比较分子力场分析方法建立DPP-IV ... 二肽肽酶IV是一类用于治疗II型糖尿病具有潜在价值的关键酶, 很多此类酶的抑制剂用于处理此病具有相当好的有效性. 一系列N-取代的甘氨酰氰基吡咯烷衍生物对于二肽肽酶具有高的活性和选择性. 我们使用比较分子力场分析方法建立DPP-IV 抑制剂——N-取代的甘氨酰氰基吡咯衍生物的三维定量构效关系, 该模型为设计用于治疗II 型糖尿病的高效DPP-IV抑制剂提供结构信息. CoMFA模型的交叉验证相关系数q2=0.575, 非交叉验证相关系数r2=0.981,绝对误差S=0.184, F9.68=388.5. 使用七个预测集检验了模型的预测能力. 所得的模型解释了已有的构效关系, 并对同类化合物有较好的预测能力, 该模型可用于指导新型的DPP-IV 抑制剂的设计与优化. 展开更多
关键词 二肽肽酶 抑制剂 糖尿病 药物 三维定量构效关系 比较分子力场
下载PDF
萘普生噻唑衍生物的设计和合成及其环氧合酶-2抑制活性的体外评价 被引量:10
3
作者 郭长彬 郭彦伸 +3 位作者 郭宗儒 肖景发 褚凤鸣 程桂芳 《化学学报》 SCIE CAS CSCD 北大核心 2006年第15期1559-1564,共6页
基于环氧合酶-2(COX-2)与COX-1结构上的差异,设计了萘普生的噻唑衍生物,以期利用COX-2的侧面口袋,增加对COX-2的结合作用.以萘普生为原料经四步反应合成7个目标化合物,其结构经核磁共振氢谱、质谱和元素分析(或高分辨质谱)确证.体外筛... 基于环氧合酶-2(COX-2)与COX-1结构上的差异,设计了萘普生的噻唑衍生物,以期利用COX-2的侧面口袋,增加对COX-2的结合作用.以萘普生为原料经四步反应合成7个目标化合物,其结构经核磁共振氢谱、质谱和元素分析(或高分辨质谱)确证.体外筛选结果表明,化合物有一定的COX-2抑制活性. 展开更多
关键词 萘普生 环氧合酶-2 抑制剂 噻唑衍生物
下载PDF
乙型肝炎表面抗原片段三维结构的同源模建及其配体的设计 被引量:6
4
作者 张媛 李泽生 +4 位作者 孙苗 肖景发 白玉白 李铁津 孙家锺 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 2005年第1期102-105,共4页
利用同源模建和分子动力学优化得到了一种乙肝表面抗原片段的三维结构 .通过对活性部位的分析 ,设计了与抗原片段相结合的配体 .讨论了 Trp1 63 ,Trp1 65和 Pro70对于紧密结合配体所起的重要作用 ,抗原片段与配体之间的氢键也决定了它... 利用同源模建和分子动力学优化得到了一种乙肝表面抗原片段的三维结构 .通过对活性部位的分析 ,设计了与抗原片段相结合的配体 .讨论了 Trp1 63 ,Trp1 65和 Pro70对于紧密结合配体所起的重要作用 ,抗原片段与配体之间的氢键也决定了它们结合的相对位置 .从复合物得到的结构信息将有助于揭示配体与乙肝抗原的作用机理 。 展开更多
关键词 同源模建 分子设计 配体从头设计 对接
下载PDF
面向国际的生命组学大数据管理体系建设 被引量:4
5
作者 赵文明 张思思 +6 位作者 唐碧霞 陈婷婷 郝丽丽 桑健 李茹姣 肖景发 章张 《大数据》 2016年第6期43-52,共10页
组学数据是生命科学研究中的一类极其重要的大数据,特别是二代测序技术的发展推动了组学大数据的爆炸式增长。通过借鉴国际数据中心建设的成功经验,分析国内组学产出数据及数据库建设、数据管理现状及应用需求,构建了面向国际的生命组... 组学数据是生命科学研究中的一类极其重要的大数据,特别是二代测序技术的发展推动了组学大数据的爆炸式增长。通过借鉴国际数据中心建设的成功经验,分析国内组学产出数据及数据库建设、数据管理现状及应用需求,构建了面向国际的生命组学大数据管理体系,涵盖组学原始序列归档库、基因组序列数据库、基因表达数据库、基因组变异数据库、DNA甲基化数据库系统等,初步形成中国组学数据资源的存储、共享与应用体系。 展开更多
关键词 组学数据 大数据 数据共享 生物信息学 基因组
下载PDF
中国人群参考基因组及基因组变异图谱资源库 被引量:4
6
作者 宋述慧 滕徐菲 肖景发 《遗传》 CAS CSCD 北大核心 2018年第11期1048-1054,共7页
随着人类基因组计划和国际千人基因组计划的实施,已公开数百个中国人个体的全基因组数据。建立高精度的中国人群参考基因组序列,发现并解析中国人群特有的序列变异,是我国未来精准医学研究的基础。为满足未来精准医学研究中国人基因组... 随着人类基因组计划和国际千人基因组计划的实施,已公开数百个中国人个体的全基因组数据。建立高精度的中国人群参考基因组序列,发现并解析中国人群特有的序列变异,是我国未来精准医学研究的基础。为满足未来精准医学研究中国人基因组数据持续增长的科学管理和深入研究的需求,中国科学院北京基因组研究所发展并建立了基于中国人群全基因组测序数据的虚拟中国人基因组数据库(Virtual Chinese Genome Database,VCGDB)和中国人群基因组变异数据库(Genome Variation Map, GVM),面向国内外用户提供数据检索、共享、下载和在线分析服务。本文重点介绍了这两个数据库的特点和功能,以及未来发展与应用前景,以期为中国人群参考基因组及基因组变异图谱资源库的推广使用、发展完善提供有益信息。 展开更多
关键词 中国人群 参考基因组 变异图谱
下载PDF
GSA-Human:人类遗传资源数据管理的公共系统 被引量:10
7
作者 张思思 陈旭 +16 位作者 陈婷婷 朱军伟 唐碧霞 王安可 董丽莉 张哲文 孙艳玲 俞彩霞 翟爽 孙玉彬 陈焕新 杜政霖 肖景发 章张 鲍一明 王彦青 赵文明 《遗传》 CAS CSCD 北大核心 2021年第10期988-993,共6页
GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资... GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资源管理条例》数据安全管理策略,提供公开访问和受控访问相结合的数据使用模式。公开访问数据允许用户自由下载与获取;受控访问数据采用申请-审核的模式,即需要通过数据管理委员会(Data Access Committee,DAC)的授权方可获得下载和使用权限。系统自上线以来,截至2021年7月,汇集数据总量已超5.27 PB。 展开更多
关键词 人类遗传资源数据管理系统 组学数据 数据汇交 数据共享
下载PDF
基于8种真核生物的整合分析揭示种属特异性小蛋白的功能和进化特征(英文)
8
作者 赵倩 肖景发 于军 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2012年第4期359-367,共9页
小蛋白(<100个氨基酸)广泛存在于三界生命中,具有重要生物功能.早期涉及小蛋白的研究主要集中于少量特殊物种中的蛋白质家族,以及在全基因组尺度预测短小开放读码框(sORFs)的算法开发,但并无跨真核物种的大规模组学分析来揭示小蛋白... 小蛋白(<100个氨基酸)广泛存在于三界生命中,具有重要生物功能.早期涉及小蛋白的研究主要集中于少量特殊物种中的蛋白质家族,以及在全基因组尺度预测短小开放读码框(sORFs)的算法开发,但并无跨真核物种的大规模组学分析来揭示小蛋白的功能和进化特征.通过对已知小蛋白和拥有短小开放读码框的基因进行全基因组尺度的计算分析,长度小于100个氨基酸的RefSeq proteins按照其序列保守性被划分为存在于所有8种真核生物、只存在于脊椎动物和只存在于哺乳动物三个进化分类中,此三个进化分类所对应的生物学功能揭示了小蛋白行使种属特异性功能的特征.进一步研究发现,大多数人类特有的小蛋白也是组织表达特异性的,并且绝大多数古老的小蛋白在人体内普遍表达.因此认为,一些真核小蛋白出现并在自然选择压力下富集,行使种属特异性功能,并且以特殊的方式进化和表达. 展开更多
关键词 真核小蛋白 选择压力 种属特异性 组织特异性表达
下载PDF
遗传密码起源初探
9
作者 肖景发 于军 《科学》 北大核心 2009年第5期32-35,共4页
生物有机体的多样性首先反映了地球作为非平衡热动力学系统的复杂性,其次是种群内部的复杂系统进化过程。不管这些复杂性如何相互作用和不断变化,生命有机体所使用的遗传信息,也就是遗传密码,却高度一致,因此这个遗传密码必定起源... 生物有机体的多样性首先反映了地球作为非平衡热动力学系统的复杂性,其次是种群内部的复杂系统进化过程。不管这些复杂性如何相互作用和不断变化,生命有机体所使用的遗传信息,也就是遗传密码,却高度一致,因此这个遗传密码必定起源于相对更早的时期,经过不断进化达到近乎完善后才固定下来。1960年代实验分子生物学领域最大的进展就是解码遗传密码。并发现它对不同的生命有机体而言基本上是统一的。但是,解释遗传密码的由来,包括为什么密码子采用了当前的分配形式,仍然是分子生物学遗留下来的几个理论上具有挑战性的问题之一。 展开更多
关键词 遗传密码 共进化假说 立体化学假说 分步进化假说 氨酰tRNA 合成酶
下载PDF
基因组科学数据的安全管理与应用 被引量:7
10
作者 李茹姣 张欣 +6 位作者 宋述慧 王彦青 邹东 肖景发 赵文明 章张 鲍一明 《大数据》 2022年第1期37-45,共9页
基因组科学数据是人口健康和国家安全的重要战略资源,存好、管好和用好基因组科学数据具有重要意义。面对我国生物数据大量产出但因存储零散、缺乏系统监管而丢失和流失,以及严重依赖国际生物组学数据库的局面,亟须从国家层面建设我国... 基因组科学数据是人口健康和国家安全的重要战略资源,存好、管好和用好基因组科学数据具有重要意义。面对我国生物数据大量产出但因存储零散、缺乏系统监管而丢失和流失,以及严重依赖国际生物组学数据库的局面,亟须从国家层面建设我国自己的生物大数据管理体系。以国家基因组科学数据中心为例,阐述了基因组科学数据汇交共享体系和标准规范、数据安全管理机制,给出了数据挖掘与应用的典型案例,并从政策机制、基础设施、软件研发、学科建设、人才培养和国际合作等方面提出对策建议。 展开更多
关键词 科学数据 基因组学 汇交共享 数据安全管理 数据应用
下载PDF
国家基因组科学数据中心:现状及展望
11
作者 陈梅丽 王彦青 +8 位作者 李茹姣 马英克 张思思 张欣 宋述慧 肖景发 赵文明 章张 鲍一明 《中国科学:生命科学》 CSCD 北大核心 2024年第6期1088-1100,共13页
面向我国人口健康和社会可持续发展的重大战略需求,国家基因组科学数据中心(National Genomics Data Center,NGDC)自2019年成立以来,已初步建成具有自主知识产权、安全可控、涵盖领域广的多维组学数据汇交、存储、管理和共享体系,涵盖... 面向我国人口健康和社会可持续发展的重大战略需求,国家基因组科学数据中心(National Genomics Data Center,NGDC)自2019年成立以来,已初步建成具有自主知识产权、安全可控、涵盖领域广的多维组学数据汇交、存储、管理和共享体系,涵盖基础组学数据资源、国家人类遗传资源、重要战略生物资源、生物安全资源以及生物信息分析工具和平台等,为人口健康、公共安全、育种改良、生物多样性等相关研究提供重要资源和参考信息.截至目前,NGDC已存储和管理27.6 PB的数据量,数据编号被Springer Nature,Elsevier,Wiley,Taylor&Francis等全球主要出版集团推荐或认可.尽管NGDC已连续六年被本领域国际权威期刊《核酸研究》称为与美国NCBI、欧洲EBI齐名的国际主要生物数据中心,但与国际一流数据中心仍存在一定差距.展望未来,NGDC将重点聚焦于数据智能审编、数据融合检索、生物大数据云平台、前沿算法工具等,同时在经费争取、人才培养和国际合作方面加大工作力度,建成国际领先的基因组科学数据中心,支撑我国生命与健康科学领域的科技创新发展和自立自强. 展开更多
关键词 基因组 生物信息 大数据 多组学 人类遗传资源 汇交管理 国家基因组科学数据中心 国家生物信息中心
原文传递
遗传密码的新排列和起源探讨 被引量:5
12
作者 肖景发 于军 《中国科学(C辑)》 CSCD 北大核心 2009年第8期717-726,共10页
根据DNA核苷酸组分的动态变化规律将遗传密码的传统排列按密码子对GC和嘌呤含量的敏感性进行了重排.新密码表可划分为2个半区(或1/2区)和4个四分区(或1/4区).就原核生物基因组而言,当GC含量增加时,物种蛋白质组所含的氨基酸倾向于使用G... 根据DNA核苷酸组分的动态变化规律将遗传密码的传统排列按密码子对GC和嘌呤含量的敏感性进行了重排.新密码表可划分为2个半区(或1/2区)和4个四分区(或1/4区).就原核生物基因组而言,当GC含量增加时,物种蛋白质组所含的氨基酸倾向于使用GC富集区和嘌呤不敏感半区所编码的氨基酸,它们均使用四重简并密码,对DNA序列的突变具有相对鲁棒性(Robustness).当GC含量降低时,大多数密码子处于AU富集区和嘌呤敏感半区,这个区域编码的氨基酸具有物理化学性质的多样性.因为当密码子第三位核苷酸(CP3)在嘌呤和嘧啶之间发生转换时,密码子所编码的氨基酸也倾向于发生变化.关于遗传密码的进化存在多种假说,包括凝固事件假说、共进化假说和立体化学假说等,每种假说均试图解释遗传密码所表现出来的某些化学和生物学规律.基于遗传密码的物理化学性质、基因组变异的规律和相关的生物学假说,本研究提出了遗传密码分步进化假说(The Stepwise Evolution Hypothesis for the Genetic Code).在人们推断的最原始的RNA世界里,原初(Primordial)遗传密码从只能识别嘌呤和嘧啶开始,编码一个或两个简单而功能明确的氨基酸.由于胞嘧啶C的化学不稳定性,最初形成的遗传密码应该仅仅由腺嘌呤A和尿嘧啶U来编码,却可得到一组7个多元化的氨基酸.随着生命复杂性的增加,鸟嘌呤G从主载操作信号的功能中释放出来,再伴随着C的引入,使遗传密码逐步扩展到12,15和20个氨基酸,最终完成全部进化步骤.遗传密码的进化过程同时也伴随以蛋白质为主体的分子机制和细胞过程的进化,包括氨酰tRNA合成酶(AARS)从初始翻译机器上的脱离、DNA作为信息载体而取代RNA以及AARS和tRNA共进化等基本过程.分子机制和细胞过程是生命的基本组成元件,它们不但自己不断地趋于完善,也促使生命体走着不尽相同的道路,或维持鲁棒性(Robustness,如细菌),或寻觅多元化(Diversity,如节肢动物和植物),或追求综合性(Complexity,如脊椎动物). 展开更多
关键词 遗传密码 分步进化假说 GC含量
原文传递
小鼠乳腺发育的转录组学研究--怀孕哺乳周期乳腺的关键调控基因 被引量:2
13
作者 周媛媛 龚未 +7 位作者 肖景发 吴佳妍 潘林林 李小暖 王绪敏 王伟伟 胡松年 于军 《中国科学:生命科学》 CSCD 北大核心 2014年第3期291-306,共16页
乳腺是哺乳动物特有的器官,90%的发育过程集中在出生之后.此外,在生殖过程中乳腺发育会经历怀孕、哺乳和退化3个阶段(称为怀孕哺乳周期).为了在转录组水平上更好地了解乳腺发育的机制,利用核糖体RNA去除法构建了小鼠乳腺3个时期(怀孕12... 乳腺是哺乳动物特有的器官,90%的发育过程集中在出生之后.此外,在生殖过程中乳腺发育会经历怀孕、哺乳和退化3个阶段(称为怀孕哺乳周期).为了在转录组水平上更好地了解乳腺发育的机制,利用核糖体RNA去除法构建了小鼠乳腺3个时期(怀孕12天、哺乳14天和退化7天)的总RNA文库,每个文库产出的数据量均大于5×107条reads.3个文库分别得到17344,10160和13739个蛋白编码基因以及1803,828和1288个ncRNAs.其中,从怀孕期到哺乳期有4843个差异表达基因(包括749个上调表达的基因和4094个下调表达的基因);从哺乳期到退化期共有4926个差异表达基因(包括4706个上调表达和220个下调表达的基因).此外,还观察到与溶酶体酶相关的基因在哺乳期乳腺中有较高的表达.通过对转录因子及ncRNAs的分析,还得到一些可能在乳腺发育的不同时期有重要调控作用的调控因子基因(如转录因子基因Trps1,Gtf2i,Tcf7l2,Nupr1,Vdr,Rb1和Aebp1;miRNA基因mir-125b,Let-7,mir-146a和mir-15等). 展开更多
关键词 小鼠乳腺 乳腺发育 转录组 rmRNA—seq MIRNAS 转录因子
原文传递
计算预知未来——基于国家高性能计算环境的生物医药应用服务社区 被引量:2
14
作者 金钟 刘倩 +1 位作者 肖景发 于坤千 《科研信息化技术与应用》 2016年第4期89-92,共4页
基于国家高性能计算环境的生物医药应用服务社区得到了国家十三五重点研发专项的继续支持,通过项目实施将进一步推进高性能计算在生物信息和药物研发领域的应用服务。项目将从生物医药应用服务社区、精准医疗和个性化药物应用示范两个... 基于国家高性能计算环境的生物医药应用服务社区得到了国家十三五重点研发专项的继续支持,通过项目实施将进一步推进高性能计算在生物信息和药物研发领域的应用服务。项目将从生物医药应用服务社区、精准医疗和个性化药物应用示范两个课题开展社区建设和应用服务推广的研究,为患者量身设计出最佳治疗方案,以期达到疗效最大化和副作用最小化;为医院临床研究提供可能的更精准更个性化的医疗解决方案,产生经济和社会效益。 展开更多
关键词 高性能计算环境 应用服务 精准医疗
原文传递
DNA测序技术引领中国基因组科学走向未来 被引量:4
15
作者 吴佳妍 肖景发 +1 位作者 张若思 于军 《中国科学:生命科学》 CSCD 北大核心 2010年第12期1169-1172,共4页
1人类基因组计划10年后,全球科学家对基因组研究的看法10年前,人类基因组草图完成,全世界都在期待着这一计划能最大限度地对人类疾病起到革命性的影响(2000年6月26日,美国总统比尔-克林顿在白宫的讲话),
关键词 人类基因组计划 DNA测序技术 科学家 人类基因组草图 中国 人类疾病 美国总统 革命性
原文传递
VTwins:有限宏基因组样本推断疾病致病微生物特征
16
作者 孟庆仁 周茜 +5 位作者 时硕 肖景发 马勤 于军 陈军 康禹 《Science Bulletin》 SCIE EI CAS CSCD 2023年第22期2806-2816,M0006,共12页
从高维、高变宏基因组数据中挖掘与疾病强关联的微生物特征是人体微生态研究的一大难题.受遗传学双生子研究的启发,本文开发了一种新型微生物特征挖掘算法——虚拟双胞胎(VTwins)算法.该算法通过将原始队列转化为具有相近的微生物组特... 从高维、高变宏基因组数据中挖掘与疾病强关联的微生物特征是人体微生态研究的一大难题.受遗传学双生子研究的启发,本文开发了一种新型微生物特征挖掘算法——虚拟双胞胎(VTwins)算法.该算法通过将原始队列转化为具有相近的微生物组特征但分组不同的配对样本形成的配对队列来消除混淆因素的影响.结果显示,VTwins在识别因果特征的敏感性方面超过传统方法,并且将所需样本规模减小10倍,就可鉴定与疾病相关的微生物或代谢途径,并通过模拟和真实数据进行验证.与其他16种同类软件进行的基准测试进一步验证了VTwins在处理高维数据和挖掘宏基因组研究中的因果关系的能力和适用性.总体而言,VTwins可直接且强大地处理高变、高维数据,在宏基因组和其他组学数据的因果关系挖掘方面具有广阔的应用前景.VTwins的开源访问网址为https://github.com/mengqingren/VTwins. 展开更多
关键词 CAUSALITY High-dimensional data METAGENOME Differential abundance Paired cohort
原文传递
基于国家高性能计算环境的生物医药应用服务社区
17
作者 金钟 +1 位作者 刘倩 肖景发 《中国科技成果》 2022年第15期16-16,共1页
高性能计算技术通过计算算力的高效集成,提升针对海量数据的处理和分析能力.我国高性能计算研究在国家五年计划支持下,不断取得突破性进展,发展迅猛.生命科学和医学领域的研究数据类型复杂多样、具有计算密集等特性,充分利用国家高性能... 高性能计算技术通过计算算力的高效集成,提升针对海量数据的处理和分析能力.我国高性能计算研究在国家五年计划支持下,不断取得突破性进展,发展迅猛.生命科学和医学领域的研究数据类型复杂多样、具有计算密集等特性,充分利用国家高性能计算环境的强大计算资源,数据分析受益良多. 展开更多
关键词 高性能计算技术 高性能计算环境 数据类型 数据分析 医学领域 计算密集 海量数据 生命科学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部