摘要
由中国科学院计算机网络信息中心、中国科学院植物研究所、深圳市中国科学院仙湖植物园“三方两地”共同合作研究建设的“达尔文树”——分子数据分析应用环境(DarwinTree——Molecular Data Analysis and Application Environment),从中国陆地植物发育系统框架的研究出发,逐步推动解决生命之树构建过程中存在的技术难题,探索利用基因和基因组信息构建生命之树的策略和方法,研究和开发DNA序列信息自动采集和生命之树自动生成技术(Automatic Reconstruction of The Tree of Life),建立生命之树信息平台及其利用体系,为最终在我国建立具有国际影响的,能很好地兼容物种分类、地理分布、形态性状、化石信息以及DNA信息的物种库(Species Bank)创造条件。DarwinTree旨在为科研人员提供数据和分析并举的工作平台,该平台将承担数据汇集和面向实际科研工作应用的双重作用。本文发布的数据集包括:(1)DarwinTree基础数据集:来自国际公共序列数据的标记处理得到的分子标记数据及其与任意阶元物种分类名称对应的统计数据集;(2)DarwinTree自测序数据集:面向中国陆地植物研究的补充测序序列数据;(3)DarwinTree中国维管植物进化数据集:已构建的中国维管植物属系统发育树的数据(Generic tree of Chinese vascular plants)。
DarwinTree(http://www.darwintree.cn)was initiated to construct a molecular data analysis and application environment for the phylogenetic study and compiled collaboratively by three organizations from Chinese Academy of Sciences,which are Computer Network Information Center(CNIC),Institute of Botany(IB)and Shenzhen Fairylake Botanical Garden(SZBG).DarwinTree is expanding its development in a global scale to build an international research alliance.It has initiated the first international campaigns with the University of Florida for the study on the phylogeny of angiosperms.Recently,DarwinTree provides an integrated bioinformatics platform that supports all phases of the analytical pathway for phylogenetic study from data collection including gene data acquisition and management to phylogenetic tree reconstruction including sequences alignment and data matrix construction,to different branches reconstruction,to assembly of large trees and mode of optimization,to visualization of the tree of life and web-based rendering,and to specific application service and data mining.The datasets included in this published paper are:(1)the basic datasets in DarwinTree:the Gene Mark Data labeled from international public sequence data and the statistical datasets with any scientific name and any mark name;(2)the sequencing datasets in DarwinTree:the complementary sequencing data for China land plants;(3)Generic tree of Chinese vascular plants datasets.
作者
孟珍
杨拓
刘红梅
黎建辉
曹巍
刘勇
杲艳平
刘奇
林小光
何星
邵靖
郑波
王学志
周园春
陈之端
林立
苏俊霞
孙苗
董晓宇
李洪雷
鲁丽敏
张景博
朱新宇
李勇
张寿洲
董慧
廖一颖
杨蕾蕾
万涛
Meng Zhen;Yang Tuo;Liu Hongmei;Li Jianhui;Cao Wei;Liu Yong;Gao Yanping;Liu Qi;Lin Xiaoguang;He Xing;Shao Jing;Zheng Bo;Wang Xuezhi;Zhou Yuanchun;Chen Zhiduan;Lin Li;Su Junxia;Sun Miao;Dong Xiaoyu;Li Honglei;Lu Limin;Zhang Jingbo;Zhu Xinyu;Li Yong;Zhang Shouzhou;Dong Hui;Liao Yiying;Yang Leilei;Wan Tao(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,P.R.China;State Key Laboratory of Systematic and Evolutionary Botany,Institute of Botany,Beijing 100093,P.R.China;Fairylake Botanical Garden,Shenzhen&Chinese Academy of Sciences,Shenzhen 518004,P.R.China)
基金
国家科技基础条件平台子专题(Y207011108)
深圳市科技研发国际合作资金项目(ZYA201007060093A)
中国科学院知识创新工程青年基金项目(Y114061108)
中国科学院计算机网络信息中心一三五规划重点培育方向专项(CNIC_PY-1405)
国家自然科学基金(91224006、 31270268和61003138)
科技部支撑计划(2014CB954100)
中科院战略先导项目(XDA06010202)
深圳市科技创新委员会资助(KQC201105310009A)