摘要
磷酸化是最重要的蛋白质翻译后修饰之一,在许多细胞过程中扮演重要角色。发展磷酸化位点精确识别的计算生物学方法,有助于对磷酸化信号转导机制的理解。本文给出一种激酶无关的磷酸化位点识别模型,称为FSID_PhSite。模型以k间隔氨基酸对组分和位置保守氨基酸组分为特征,应用多样性增量特征选择技术进行特征筛选,将选出的特征输入到支持向量机算法进行识别。在正负样本数之比为1:1的情形下,对磷酸化丝氨酸、苏氨酸和酪氨酸在独立测试集检验,识别精度分别达到84.34%、82.32%和68.89%。结果优于现有的激酶无关磷酸化位点识别模型。
出处
《计算生物学》
2018年第1期24-32,共9页
Hans Journal of Computational Biology
基金
内蒙古自治区自然科学基金资助项目(批准号:2015MS0331和2016MS0306).
关键词
蛋白质磷酸化位点
多样性增量特征选择
支持向量机
Protein Phosphorylation Site
Feature Selection Based on Increment of Diversity
Support Vector Machine