摘要
序列比对是寻找蛋白质结构保守性区域的常用方法,然而当序列相似小于30%时比对准确度却不高,这是因为在这些序列中具有相似结构功能的不同残基在序列比对中往往被错误配对.基于相似的物理化学性质,某些残基可以被归类为一组,而应用这些简化后的残基字符可以有效地简化蛋白质序列的复杂性并保持序列的主要信息.因此,如果20种天然氨基酸残基能够正确的归类,可以有效地提高序列比对的准确度.本文基于蛋白质结构比对数据库DAPS,提出了一种新的氨基酸残基归类方法,并可以同时得到不同简化程度下的替代矩阵用于序列比对.归类的合理性由相互熵方法确认,并且应用简化后的字符表于序列比对来识别蛋白质的结构保守区域.结果表明,当氨基酸残基字符简化到9个左右时能够有效地提高序列比对的准确度.
出处
《中国科学(C辑)》
CSCD
北大核心
2006年第6期552-562,共11页
Science in China(Series C)