通过构建牛热休克蛋白A6(heat shock protein A6,HSPA6)序列与其他生物的系统进化树,以及运用生物信息学方法分析牛HSPA6蛋白的基本理化性质、亲疏水性等,并结合蛋白互作网络,探究牛HSPA6基因编码蛋白的结构和功能特性。结果显示,牛HSPA...通过构建牛热休克蛋白A6(heat shock protein A6,HSPA6)序列与其他生物的系统进化树,以及运用生物信息学方法分析牛HSPA6蛋白的基本理化性质、亲疏水性等,并结合蛋白互作网络,探究牛HSPA6基因编码蛋白的结构和功能特性。结果显示,牛HSPA6蛋白与羊、长江江豚等哺乳动物的氨基酸序列相似性较高;牛HSPA6蛋白分子质量为70 570.64 u,理论等电点为5.66,为酸性亲水性蛋白,无跨膜结构和信号肽;可能存在11个得分>0.900的磷酸化位点,与N-糖基化激活位点可能位于后端碱基;牛HSPA6蛋白是一种主要由40.38%的α-螺旋和33.65%的无规卷曲组成的二级结构相对稳定的蛋白质,包含N-端核苷酸结合域和C-端多肽结合域两个主要的结构域,主要在细胞质中发挥作用;蛋白质互作网络构建结果显示,牛HSPA6蛋白主要与BAG1、DNAJA4、DNAJB1、DNAJC2等蛋白发生互作,参与腺苷酸交换因子活性、ATP酶调节活性、伴侣绑定等,表明牛HSPA6蛋白在牛机体能量代谢等过程中发挥潜在生物学功能。这些多重生物信息学分析为深入探讨牛HSPA6蛋白对肉品质的影响机制提供了理论依据。展开更多
生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通...生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质?蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质?蛋白质互作信息进行预测。结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。展开更多
为了解决目前的关键蛋白质预测方法对生物功能的分析不够深入的情况,利用蛋白质复合物信息,提出1种基于随机游走模型,结合蛋白质相互作用网络中的边聚集系数等数据来预测关键蛋白质的RWP(random walk method for predicting essential p...为了解决目前的关键蛋白质预测方法对生物功能的分析不够深入的情况,利用蛋白质复合物信息,提出1种基于随机游走模型,结合蛋白质相互作用网络中的边聚集系数等数据来预测关键蛋白质的RWP(random walk method for predicting essential proteins)算法。在酿酒酵母(Saccharomyces cerevisiae)蛋白质相互作用网络上,以敏感度、特异性、阳性预测值、阴性预测值、准确率等5个统计学指标为评价标准,将RWP与介数中心性、度中心性、信息中心性、CSC算法及LIDC算法等5种用于预测关键蛋白质的方法进行对比实验。结果表明:RWP在关键蛋白质识别率等方面优于这5种测度方法,它具有较好的预测关键蛋白质的性能。展开更多
文摘生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质?蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质?蛋白质互作信息进行预测。结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。
文摘为了解决目前的关键蛋白质预测方法对生物功能的分析不够深入的情况,利用蛋白质复合物信息,提出1种基于随机游走模型,结合蛋白质相互作用网络中的边聚集系数等数据来预测关键蛋白质的RWP(random walk method for predicting essential proteins)算法。在酿酒酵母(Saccharomyces cerevisiae)蛋白质相互作用网络上,以敏感度、特异性、阳性预测值、阴性预测值、准确率等5个统计学指标为评价标准,将RWP与介数中心性、度中心性、信息中心性、CSC算法及LIDC算法等5种用于预测关键蛋白质的方法进行对比实验。结果表明:RWP在关键蛋白质识别率等方面优于这5种测度方法,它具有较好的预测关键蛋白质的性能。