-
题名基于多重进化矩阵的蛋白质特征向量构造方法
被引量:1
- 1
-
-
作者
杜月寒
鹿文鹏
刘毅慧
成金勇
-
机构
齐鲁工业大学(山东省科学院)信息学院
-
出处
《计算机系统应用》
2018年第2期180-185,共6页
-
基金
国家自然科学基金(61375013
61502259)
山东省自然科学基金(ZR2013FM020)
-
文摘
特征向量的构造是蛋白质二级结构预测的一个关键问题.现有的研究方法,通常只使用BLOSUM62进化矩阵生成PSSM矩阵,对蛋白质进化过程中存在的氨基酸残基突变现象缺乏考虑.本文提出利用多重进化矩阵构造蛋白质特征向量,其融合了不同进化时间的PSSM矩阵,不仅能够很好地反映序列中氨基酸的位置信息,而且能够反映序列进化过程中氨基酸位点发生突变产生的影响.本文通过组合不同进化程度的矩阵来构造特征向量,选用逻辑回归、随机森林和多分类支持向量机三种分类算法作为预测工具,利用网格搜索法和交叉实验法优化参数,在RS126、CB513和25PDB公用数据集上进行了若干组实验.对比实验结果表明,本文所提出基于多重进化矩阵的蛋白质特征向量构造方法能够有效提高蛋白质二级结构的预测精度.
-
关键词
蛋白质结构预测
多重进化矩阵
逻辑回归
随机森林
多分类支持向量机
-
Keywords
protein secondary structure prediction
multiple evolutionary matrix
logistics
randomforest
M-SVMcs
-
分类号
Q51
[生物学—生物化学]
TP181
[自动化与计算机技术—控制理论与控制工程]
-