摘要
本文从swiss-prot中选取经过试验验证的水稻蛋白质磷酸化位点数据作为训练集合,应用蛋白质序列特征提取方法 Composition of k-spaced residues pairs(CKSAAP),为利用SVM算法构建专门针对水稻蛋白质磷酸化位点的预测工具做准备。CKSAAP方法利用在序列片断中残基的K个间隔距离的组成,进一步反映了残基之间的相关性。本文利用LibSVM软件包对已通过改进过得CKSAAP方法特征提取出来的数值特征对磷酸化位点进行预测,从而为之后构建水稻蛋白质磷酸化位点的预测工具做准备。结果表明,本文基于SVM和CKSAAP方法的水稻蛋白质磷酸化位点预测在丝氨酸,苏氨酸和酪氨酸的平均预测准确性为80.638%,马修斯系数为0.611。与PlantPhos和Musite的预测性能的对比结果显示,在磷酸化各氨基酸位点的预测性能高于PlantPhos及Musite。
出处
《湖北科技学院学报》
2014年第7期9-10,共2页
Journal of Hubei University of Science and Technology