生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通...生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质?蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质?蛋白质互作信息进行预测。结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。展开更多
提出一种基于颜色熵极值及颜色熵互信息的双重熵快速提取感兴趣区域(Region of Interest,ROI)的多特征图像优化分类方法。首先使用颜色熵极值性确定最相关区域,然后基于颜色熵互信息进行子区域增长,快速确定连续ROI区域,并基于所提取的...提出一种基于颜色熵极值及颜色熵互信息的双重熵快速提取感兴趣区域(Region of Interest,ROI)的多特征图像优化分类方法。首先使用颜色熵极值性确定最相关区域,然后基于颜色熵互信息进行子区域增长,快速确定连续ROI区域,并基于所提取的ROI对图像进行Dense-SIFT特征描述,随后使用K-means聚类生成视觉词典,为了利用空间局部信息,采用金字塔匹配方法,最后将特征输入到SVM进行分类。分别在Caltech101和Caltech256数据库上选取8组数据进行实验,使用ROI提取算法获得的平均分类准确率较未使用之前提高6. 86%,收敛速率提升近一半。加入颜色熵、颜色三阶矩特征后,平均分类准确率进一步提高2. 36%,较改进之前总共提高9. 22%。展开更多
文摘生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质?蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质?蛋白质互作信息进行预测。结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。