-
题名1种蛋白质Loop片段结构的概率生成模型
- 1
-
-
作者
杨鹏
吕强
杨凌云
吴进珍
温炜
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理重点实验室
-
出处
《计算机与应用化学》
CAS
CSCD
北大核心
2010年第5期573-576,共4页
-
基金
国家自然科学基金项目(60970055)
-
文摘
在计算生物学中,根据蛋白质的氨基酸序列预测蛋白质的结构是尚未解决的重要问题之一,而其中的1个难点是预测蛋白质中Loop片段的结构。本文用1阶马尔可夫模型为基础,通过对其训练,可根据氨基酸串和2级结构信息为蛋白质Loop片段概率建模和采样。其中用Ramachandran图示法的二面角对描述蛋白质结构,模型的训练和推理通过工具包Mocapy来完成。并使用KL交叉熵和角度差异值作为实验检验标准来完成Loop分布情况的测试实验,同时在从头预测Loop结构实验中预测CASP8中8个自由建模的蛋白质结构。与最流行的方法相比,本文提出的模型因为改进了Loop段的预测精度,从而可使得到的二面角对更加接近真实Loop结构中分布,同时在从头预测中提高整个蛋白质结构的预测精度。并且由于本文的模型具有概率推理特性,故在理论上也更具有无偏见性。
-
关键词
蛋白质Loop
1阶马尔可夫概率生成模型
双变量yon
Mises分布
-
Keywords
protein Loop, first-order Markov model, bivariate von Mises distribution
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
O6-39
[理学—化学]
-