全基因组关联分析(genome-wide association study,GWAS)的理论及应用是近十几年来国内外数量性状研究的热点,但是以往GWAS方法注重于个别主要QTL/基因的检测与发掘。为了相对全面地解析全基因组QTL及其等位基因构成,本研究提出了限制...全基因组关联分析(genome-wide association study,GWAS)的理论及应用是近十几年来国内外数量性状研究的热点,但是以往GWAS方法注重于个别主要QTL/基因的检测与发掘。为了相对全面地解析全基因组QTL及其等位基因构成,本研究提出了限制性两阶段多位点GWAS方法(RTM-GWAS,https://github.com/njau-sri/rtm-gwas)。RTM-GWAS首先将多个相邻且紧密连锁的SNP分组,成为具有多个单倍型(复等位变异)的连锁不平衡区段(SNPLDB)标记,然后采用两阶段分析策略,基于多位点复等位变异遗传模型,在节省计算空间的条件下保障全基因组QTL及其复等位变异检出的精确度。和以往GWAS方法相比,RTM-GWAS以性状遗传率为上限,能够较充分地检测出QTL及其相应的复等位变异并能有效地控制假阳性的膨胀。由其结果建立的QTL-allele矩阵代表了群体中所研究性状的全部遗传组成。依据这种QTL-allele矩阵的信息,可以设计最优基因型的遗传组成,预测群体中最优化的杂交组合,并用以进行群体遗传和特有与新生等位变异的研究。本研究首先对RTM-GWAS方法的特点和计算程序功能进行说明,然后通过大豆试验数据说明RTM-GWAS计算程序的使用方法。展开更多
全基因组关联分析(genome-wide association studies,GWAS)通过建立全基因组高密度分子标记以检测基因型与表型间的关联性,已成为动植物数量性状遗传解析的主要方法。然而,以往GWAS方法只注重于个别主要QTL的检测,而且使用仅有2个等位...全基因组关联分析(genome-wide association studies,GWAS)通过建立全基因组高密度分子标记以检测基因型与表型间的关联性,已成为动植物数量性状遗传解析的主要方法。然而,以往GWAS方法只注重于个别主要QTL的检测,而且使用仅有2个等位变异的SNP标记不能检测自然群体中广泛存在的复等位变异,一定程度限制了GWAS的应用。限制性两阶段多位点全基因组关联分析方法(RTM-GWAS)首先根据全基因组高密度SNP标记间的连锁不平衡程度,将多个相邻且紧密连锁的SNP标记组成为具有复等位变异(单倍型)的连锁不平衡区段(SNPLDB)标记。其次,RTM-GWAS使用由SNPLDB标记计算的遗传相似系数矩阵作为群体结构偏差的通用估计,并提取该矩阵的特征向量作为模型协变量以降低由群体结构偏差导致的假阳性。最后,利用具有复等位变异的SNPLDB标记与建立的多位点复等位变异模型,RTM-GWAS将性状遗传率作为QTL表型变异解释率的上限,通过两阶段分析策略高效地进行全基因组QTL及其复等位变异的检测,并最终构建多QTL遗传模型。该法还可以基于性状小区观测值,建立QTL与环境互作多位点模型,不仅能检测与环境有交互作用的主效应QTL,还能检测仅与环境有交互作用的无主效应QTL。RTM-GWAS不仅解决了以往GWAS不能估计复等位变异的问题,而且通过使用多位点模型拟合多个QTL提高了检测功效并能有效地控制假阳性的膨胀,为全面解析自然群体QTL及其复等变异提供了通道。该法能估计出等位基因的效应及其在群体内的相对频率,由其结果建立的QTL-allele矩阵代表了目标性状在群体中的全部遗传组成,不仅可用于候选基因发掘,还为群体内QTL及其复等位变异(基因及其复等位基因)的动态研究(群体遗传分化以及特有与新生等位变异)提供了新的工具。依据QTL-allele矩阵,还能进一步利用计算机模拟产生杂交组合后代基因型,并预测杂交组合后代纯合群体的表现,从而进行优化组合设计与分子设计育种。此外,RTM-GWAS还适用于双亲杂交后代重组自交系群体以及多亲杂交后代巢式关联作图群体,因避免了群体结构偏离的干扰,检测功效更高。本文归纳了RTM-GWAS的原理和方法,并综述了其在遗传育种研究中的应用。展开更多
多位点关联分析在人和动植物遗传研究中的应用日益广泛。本文综述了以混合线性模型(mixed linear model,MLM)为框架下多位点关联分析的主要方法及重要软件平台,包括全基因组关联分析(genome-wide association study,GWAS)混合线性模型...多位点关联分析在人和动植物遗传研究中的应用日益广泛。本文综述了以混合线性模型(mixed linear model,MLM)为框架下多位点关联分析的主要方法及重要软件平台,包括全基因组关联分析(genome-wide association study,GWAS)混合线性模型方法学的建立与发展,多位点模型方法的发展,多位点GWAS混合线性模型方法的发展,以及GWAS方法学研究的影响因素,最后展望了关联分析的发展方向。展开更多
在动物全基因组关联分析(Genome-Wide Association Studies,GWAS)中,线性混合模型通过校正群体分层、个体间亲缘关系和微效多基因对标记关联检验的影响有效地控制了数量性状基因座(Quantitative Trait Locus,QTL)检测的假阳性率。文章...在动物全基因组关联分析(Genome-Wide Association Studies,GWAS)中,线性混合模型通过校正群体分层、个体间亲缘关系和微效多基因对标记关联检验的影响有效地控制了数量性状基因座(Quantitative Trait Locus,QTL)检测的假阳性率。文章综述了混合模型之于GWAS基因定位的求解策略和方法,包括逐个标记的GWAS方法和联合多标记的GWAS方法。评论了这些方法在计算效率、QTL检测效率和模型拟合度方面的优缺点。指出了完善的全基因组关联分析方法不仅能够高效率地检测QTL,还能够最优地拟合性状表型值和预测基因组育种值。展开更多
文摘全基因组关联分析(genome-wide association study,GWAS)的理论及应用是近十几年来国内外数量性状研究的热点,但是以往GWAS方法注重于个别主要QTL/基因的检测与发掘。为了相对全面地解析全基因组QTL及其等位基因构成,本研究提出了限制性两阶段多位点GWAS方法(RTM-GWAS,https://github.com/njau-sri/rtm-gwas)。RTM-GWAS首先将多个相邻且紧密连锁的SNP分组,成为具有多个单倍型(复等位变异)的连锁不平衡区段(SNPLDB)标记,然后采用两阶段分析策略,基于多位点复等位变异遗传模型,在节省计算空间的条件下保障全基因组QTL及其复等位变异检出的精确度。和以往GWAS方法相比,RTM-GWAS以性状遗传率为上限,能够较充分地检测出QTL及其相应的复等位变异并能有效地控制假阳性的膨胀。由其结果建立的QTL-allele矩阵代表了群体中所研究性状的全部遗传组成。依据这种QTL-allele矩阵的信息,可以设计最优基因型的遗传组成,预测群体中最优化的杂交组合,并用以进行群体遗传和特有与新生等位变异的研究。本研究首先对RTM-GWAS方法的特点和计算程序功能进行说明,然后通过大豆试验数据说明RTM-GWAS计算程序的使用方法。
文摘全基因组关联分析(genome-wide association studies,GWAS)通过建立全基因组高密度分子标记以检测基因型与表型间的关联性,已成为动植物数量性状遗传解析的主要方法。然而,以往GWAS方法只注重于个别主要QTL的检测,而且使用仅有2个等位变异的SNP标记不能检测自然群体中广泛存在的复等位变异,一定程度限制了GWAS的应用。限制性两阶段多位点全基因组关联分析方法(RTM-GWAS)首先根据全基因组高密度SNP标记间的连锁不平衡程度,将多个相邻且紧密连锁的SNP标记组成为具有复等位变异(单倍型)的连锁不平衡区段(SNPLDB)标记。其次,RTM-GWAS使用由SNPLDB标记计算的遗传相似系数矩阵作为群体结构偏差的通用估计,并提取该矩阵的特征向量作为模型协变量以降低由群体结构偏差导致的假阳性。最后,利用具有复等位变异的SNPLDB标记与建立的多位点复等位变异模型,RTM-GWAS将性状遗传率作为QTL表型变异解释率的上限,通过两阶段分析策略高效地进行全基因组QTL及其复等位变异的检测,并最终构建多QTL遗传模型。该法还可以基于性状小区观测值,建立QTL与环境互作多位点模型,不仅能检测与环境有交互作用的主效应QTL,还能检测仅与环境有交互作用的无主效应QTL。RTM-GWAS不仅解决了以往GWAS不能估计复等位变异的问题,而且通过使用多位点模型拟合多个QTL提高了检测功效并能有效地控制假阳性的膨胀,为全面解析自然群体QTL及其复等变异提供了通道。该法能估计出等位基因的效应及其在群体内的相对频率,由其结果建立的QTL-allele矩阵代表了目标性状在群体中的全部遗传组成,不仅可用于候选基因发掘,还为群体内QTL及其复等位变异(基因及其复等位基因)的动态研究(群体遗传分化以及特有与新生等位变异)提供了新的工具。依据QTL-allele矩阵,还能进一步利用计算机模拟产生杂交组合后代基因型,并预测杂交组合后代纯合群体的表现,从而进行优化组合设计与分子设计育种。此外,RTM-GWAS还适用于双亲杂交后代重组自交系群体以及多亲杂交后代巢式关联作图群体,因避免了群体结构偏离的干扰,检测功效更高。本文归纳了RTM-GWAS的原理和方法,并综述了其在遗传育种研究中的应用。
文摘多位点关联分析在人和动植物遗传研究中的应用日益广泛。本文综述了以混合线性模型(mixed linear model,MLM)为框架下多位点关联分析的主要方法及重要软件平台,包括全基因组关联分析(genome-wide association study,GWAS)混合线性模型方法学的建立与发展,多位点模型方法的发展,多位点GWAS混合线性模型方法的发展,以及GWAS方法学研究的影响因素,最后展望了关联分析的发展方向。
文摘在动物全基因组关联分析(Genome-Wide Association Studies,GWAS)中,线性混合模型通过校正群体分层、个体间亲缘关系和微效多基因对标记关联检验的影响有效地控制了数量性状基因座(Quantitative Trait Locus,QTL)检测的假阳性率。文章综述了混合模型之于GWAS基因定位的求解策略和方法,包括逐个标记的GWAS方法和联合多标记的GWAS方法。评论了这些方法在计算效率、QTL检测效率和模型拟合度方面的优缺点。指出了完善的全基因组关联分析方法不仅能够高效率地检测QTL,还能够最优地拟合性状表型值和预测基因组育种值。
基金国家自然科学基金项目(31301004)中央高校基本科研业务费项目(KJQN201422)资助+1 种基金supported by National Natural Science Foundation of China(31301004)Fundamental Research Funds for the Central Universities(KJQN201422)