-
题名基于可持续更新模板库的蛋白质二级结构预测器
- 1
-
-
作者
周鹏杰
文明
丛培盛
李通化
-
机构
同济大学化学科学与工程学院
中南大学化学化工学院
-
出处
《计算生物学》
2017年第2期13-22,共10页
-
基金
国家自然科学基金资助项目(21275108)。
-
文摘
蛋白质二级结构预测是计算生物学研究的重要领域。虽然现有优秀的机器学习方法的预测准确度已经超过80%,但是它们都有共同的缺陷:不能及时学习最新实测的蛋白质结构信息,不能持续修改模型和参数,从而满足人们在日新月异时代对蛋白质二级结构预测的要求。本文构建了基于可持续更新模板库的蛋白质二级结构预测器:SIPSS。我们的新方法以同源序列的结构保守性为基本原理。首先我们建立了一个可持续更新的模板库,每月自动从蛋白质数据库中下载新测定的蛋白质结构数据,经过筛选将新的序列和结构信息补充进模板库。然后对于查询序列,用多重同源比对与模板库比对,得到新的变量:SPSSM变量。最后,我们以SPSSM为变量,用条件随机场建模和预测。实际测试表明,SIPSS能够在线学习新的蛋白质结构信息,对新近测定的蛋白质二级结构预测准确度(80.6%)明显高于现有的预测器。SIPSS网站:http://cheminfo.tongji.edu.cn/SIPSS/,可供用户免费使用。
-
关键词
蛋白质二级结构
预测
持续更新
spssm变量
条件随机场
-
分类号
Q5
[生物学—生物化学]
-