摘要
蛋白质相互作用位点的识别对于突变设计和预测蛋白质相互作用的网络是非常重要的.基于支持向量机学习方法,该文提出一种用于预测蛋白质相互作用位点的有效数据属性抽取方法,该方法利用蛋白质的序列信息、蛋白质残基的可及表面积和进化率来构造向量,通过十倍交叉验证来对数据进行训练和预测.实际计算的结果显示,该方法的准确率为72.19%,比只利用序列信息和进化率信息的方法提高了5.71%.
Identification of protein-protein interaction sites is essential for the mutant design and prediction of protein-protein networks. This paper proposes a method for predicting protein-protein interaction sites by combining support vector machine (SVM) and the sequence profiles, the accessible surface area (ASA) and the evolution rate of a residue. The dataset is trained and tested using 10-fold cross-validation. Accuracy of the proposed method is 72.91%, 5.71% higher than that of the method only using the sequence profiles and the evolution rate of a residue.
出处
《应用科学学报》
CAS
CSCD
北大核心
2008年第4期403-408,共6页
Journal of Applied Sciences
基金
国家自然科学基金(No.30571059)
国家"863"高技术研究发展计划(No.2006AA02Z190)资助项目
关键词
蛋白质相互作用位点
支持向量机
序列信息
可及表面积
进化率
protein-protein interaction sites, support vector machine ( SVM), sequence profiles, accessible surfacearea, evolution rate