-
题名基于位点相关概率模型的富亮氨酸重复序列预测
- 1
-
-
作者
巩晶
李雪
陶超
魏天迪
-
机构
山东大学医学院癌症研究中心
山东大学泰山学堂
山东大学生命科学学院
山东省齐鲁干细胞工程有限公司博士后工作站
-
出处
《中国科技论文》
CAS
北大核心
2015年第6期626-628,637,共4页
-
基金
高等学校博士学科点专项科研基金资助项目(20110131120024
20110131120045)
-
文摘
富亮氨酸重复序列(leucine-rich repeat,LRR)是一种广泛存在的蛋白质结构基序,在诸多重要生命过程中起关键性作用并与诸多人类疾病紧密相关。研究LRR中各个位点之间的氨基酸分布的相关性,并基于此相关性建立概率模型,可应用于序列水平上的LRR预测,以提高LRR预测的准确度。本文从LRRML数据库中提取已知的LRR蛋白质序列作为训练集和测试集;为LRR各个位点上氨基酸的分布数据构建4种不同的概率模型,包括位点相关和位点不相关概率模型;再通过机器学习和K-折交叉验证的方法,确定可以用于LRR预测的最佳模型。结果表明,位点相关概率模型和位点不相关概率模型以不同权重相加之后的综合模型在LRR预测中显示出高的准确度。LRR中各个位点之间的氨基酸分布存在一定的相关性,此相关性可作为重要参数应用于LRR预测。
-
关键词
生物信息学
富亮氨酸重复序列
序列算法
位点相关概率模型
-
Keywords
bioinformatics
leucine-rich repeat
motif prediction
position-related possibility model
-
分类号
Q517
[生物学—生物化学]
-