摘要
蛋白质相互作用数据具有较高的假阳性率和假阴性率,这直接导致计算方法从中预测蛋白质复合物会产生较大的误差。为了弥补数据的这种先天性不足,通过结合多数据源,一种新的蛋白质复合物预测算法被提出。匹配分析和GO功能富集分析被用于评估算法的性能。测试结果表明,新算法远优于以前的其他算法。
The computational methods used to predict protein complexes from the protein interaction network have a great error because of the high false positive rate and false negative rate of protein interaction data. To compensate for this, a new protein complex prediction approach is proposed via the integration of multiply data sources. Match- ing analysis and GO functional enrichment analysis are performed as so to estimate the performance of the algo- rithm. The results show that the new algorithm is much better than previous ones.
出处
《计算机工程与应用》
CSCD
2012年第27期105-108,共4页
Computer Engineering and Applications
基金
湖南省教育厅科研项目(No.11C0281)
湖南省科技厅科技计划项目(No.2011GK3138
No.2010GK3049)
湖南省高校科技创新团队支持计划(湘教通[2010]212号)
关键词
蛋白质相互作用
基因表达谱
关键蛋白质
蛋白质复合物
匹配统计
基因本体
功能富集
protein interaction
gene expression profiles
essential protein
protein complex
matching statistics
gene ontology
functional enrichment