-
题名面向蛋白质功能位点识别的机器学习平台构建
被引量:3
- 1
-
-
作者
胡敏菁
吴建盛
施识帆
刘宏德
孙啸
-
机构
东南大学生物电子学国家重点实验室生物科学与医学工程学院
-
出处
《生物信息学》
2010年第1期12-15,共4页
-
基金
国家自然科学基金(60671018
60771024)
-
文摘
有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vectormachine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包括序列的基本信息、物化特征、结构信息及序列保守性特征等),以编码好的样本作为训练数据,利用SVM进行训练,得到敏感性、特异性、Matthew相关系数、准确率及ROC曲线等评价指标,反复测试,得到评价指标最优的SVM模型后,便可以用来预测蛋白质序列上的功能位点。该平台除了应用在预测蛋白质功能位点之外,还可以应用于疾病相关单核苷酸多态性(SNP)预测分析、预测蛋白质结构域分析、生物分子间的相互作用等。
-
关键词
蛋白质功能位点预测
机器学习
支持向量机
-
Keywords
protein function sites prediction machine learning support vector machine
-
分类号
Q811
[生物学—生物工程]
-