期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类 被引量:2
1
作者 姜小莹 朱俊东 +1 位作者 李晓波 张同亮 《生物物理学报》 CAS CSCD 北大核心 2008年第1期43-48,共6页
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)... 蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具。 展开更多
关键词 蛋白质结构类预测 伪氨基酸组成 模糊支持向量机 遗传算法
下载PDF
基于不同标度伪氨基酸组成预测脂肪酶的类型 被引量:1
2
作者 张光亚 李红春 +1 位作者 高嘉强 方柏山 《生物工程学报》 CAS CSCD 北大核心 2008年第11期1968-1974,共7页
从序列出发预测某蛋白质是否为脂肪酶以及属于哪种脂肪酶具有重要的理论和应用价值。提出了基于Z标度和T标度的伪氨基酸组成方法提取序列特征值,采用了k-近邻算法回答上述问题。经参数选择后,三种方法在各自最优运行参数下,其10倍交叉... 从序列出发预测某蛋白质是否为脂肪酶以及属于哪种脂肪酶具有重要的理论和应用价值。提出了基于Z标度和T标度的伪氨基酸组成方法提取序列特征值,采用了k-近邻算法回答上述问题。经参数选择后,三种方法在各自最优运行参数下,其10倍交叉验证的结果为:对脂肪酶和非脂肪酶预测精度分别为92.8%、91.4%和91.3%;对脂肪酶类型预测的精度分别为92.3%、90.3%和89.7%。其中基于Z标度伪氨基酸组成效果最佳,基于T标度的次之,但均明显优于其他6种常见的特征值提取方法,并对其可能的原因进行了探讨。 展开更多
关键词 脂肪酶 Z-标度 T-标度 伪氨基酸组成 K-近邻
下载PDF
基于修正的伪氨基酸组成预测氧化还原酶辅酶类型 被引量:1
3
作者 张光亚 李红春 方柏山 《生物工程学报》 CAS CSCD 北大核心 2008年第8期1439-1445,共7页
从序列出发快速确定氧化还原酶的辅酶依赖类型对于了解其结构和功能、催化机制及构建辅酶再生体系具有重要指导作用。对Chou提出的伪氨基酸组成方法进行了修正并用于提取氧化还原酶序列特征值,采用k-近邻算法预测其辅酶依赖类型。当λ=4... 从序列出发快速确定氧化还原酶的辅酶依赖类型对于了解其结构和功能、催化机制及构建辅酶再生体系具有重要指导作用。对Chou提出的伪氨基酸组成方法进行了修正并用于提取氧化还原酶序列特征值,采用k-近邻算法预测其辅酶依赖类型。当λ=48,w=0.1时,10倍交叉验证结果表明:其ROC曲线下面积为0.9536,预测精度达92.0%,比最优条件下伪氨基酸组成预测精度提高了3.5%;与其他7种常见特征值提取方法相比,修正的伪氨基酸组成表现最好。结果表明从序列出发预测氧化还原酶辅酶依赖类型是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值方法。 展开更多
关键词 氧化还原酶 辅酶依赖类型 修正的伪氨基酸组成 κ-近邻 ROC曲线下面积
下载PDF
基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测
4
作者 王晓 杨鹏鹏 +1 位作者 王榕 李辉 《郑州轻工业学院学报(自然科学版)》 CAS 2015年第5期85-87,共3页
针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时... 针对多数已有的计算方法无法同时预测抗菌肽的多种功能类型的问题,提出一种基于伪氨基酸组成和多标记最近邻算法的抗菌肽功能类型预测的系统方法:采用伪氨基酸组成抽取抗菌肽序列的特征向量,并且引入多标记最近邻算法作为预测引擎,同时预测抗菌肽的多种功能类型.实验结果表明,本方法显著地提高了预测性能,为该领域的进一步研究提供了一个有用的工具. 展开更多
关键词 抗菌肽 伪氨基酸组成 多标记分类 多标记最近邻算法
下载PDF
使用伪氨基酸组成和BP神经网络预测类弹性蛋白多肽的相变温度
5
作者 黄凯宗 张光亚 《华侨大学学报(自然科学版)》 CAS 北大核心 2011年第2期194-197,共4页
根据获得的16条ELP序列及相变温度的数据,利用伪氨基酸组成方法提取其序列特征值.将伪氨基酸组成中的相关系数部分作为类弹性蛋白的特征向量,从类弹性蛋白序列出发,利用最小中位方差回归,找出与其序列相关系数的最佳阶数.运用均匀设计法... 根据获得的16条ELP序列及相变温度的数据,利用伪氨基酸组成方法提取其序列特征值.将伪氨基酸组成中的相关系数部分作为类弹性蛋白的特征向量,从类弹性蛋白序列出发,利用最小中位方差回归,找出与其序列相关系数的最佳阶数.运用均匀设计法,分别对支持向量机与BP神经网络参数进行优化.结果表明:BP神经网络获得的预测模型最佳,相变温度绝对误差为0.39℃,均方根误差为0.89℃. 展开更多
关键词 类弹性蛋白 相变温度 伪氨基酸组成方法 支持向量机 BP神经网络
下载PDF
基于分段伪氨基酸组成成分特征提取方法预测蛋白质亚细胞定位 被引量:5
6
作者 杨会芳 程咏梅 +1 位作者 张绍武 潘泉 《生物物理学报》 CAS CSCD 北大核心 2008年第3期232-238,共7页
蛋白质的亚细胞定位与蛋白质的功能密切相关,其定位预测有助于人们了解蛋白质功能。文章提出一种分段伪氨基酸组成成分特征提取方法,采用支持向量机算法对Chou构建的两个蛋白质亚细胞定位数据集(C2129,CS2423)进行了分类研究,并采用总... 蛋白质的亚细胞定位与蛋白质的功能密切相关,其定位预测有助于人们了解蛋白质功能。文章提出一种分段伪氨基酸组成成分特征提取方法,采用支持向量机算法对Chou构建的两个蛋白质亚细胞定位数据集(C2129,CS2423)进行了分类研究,并采用总分类精度Q3、内容平衡精度指数Q9等参数评估预测分类系统性能。预测结果表明,基于分段伪氨基酸组成成分特征提取方法的预测性能,优于基于完整蛋白质序列的伪氨基酸组成成分特征提取方法。例如,基于分段矩描述子伪氨基酸组成成分特征提取方法,数据集C2129的Q3和Q9分别为84.7%和60.8%,比基于完整蛋白质序列的矩描述子伪氨基酸组成成分特征提取方法分别提高1.8和2.2个百分点,且Q3比现有Xiao等人的方法提高了9.1个百分点。基于分段伪氨基酸组成成分特征提取方法构成的特征向量不仅包含残基之间的位置信息,而且还包含蛋白质子序列之间的耦合信息,另外蛋白质分段子序列可能和蛋白质的功能域有一定的联系,从而使这一方法能够有效地预测蛋白质亚细胞定位。 展开更多
关键词 分段伪氨基酸组成成分 支持向量机 特征提取 亚细胞定位
下载PDF
基于广义伪氨基酸组成的蛋白质结构类型预测 被引量:1
7
作者 何欣欣 王爱华 李春 《宜春学院学报》 2011年第8期19-22,共4页
在传统的20种氨基酸组成的基础上,根据氨基酸自身的6种重要性质和6种氨基酸疏水模式构造了32-D特征向量来表示蛋白质序列,然后借助于贝叶斯决策对于同源性不超过25%的数据集进行蛋白质结构类型的预测研究,正确率达到55%左右。
关键词 蛋白质序列 广义伪氨基酸组成 蛋白质结构类型预测
下载PDF
基于近似熵的伪氨基酸组成预测蛋白质亚核定位
8
作者 张同亮 丁永生 +1 位作者 顾全 孙登宽 《生物物理学报》 CAS CSCD 北大核心 2008年第3期239-244,共6页
了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离... 了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法。计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具。与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率。 展开更多
关键词 蛋白质亚核定位 伪氨基酸组成 近似熵 ADABOOST分类器
下载PDF
伪氨基酸组成及其推广与应用
9
作者 赵佳玲 郑卓 李春 《轻工科技》 2019年第9期29-30,共2页
随着生命科学的发展,海量的生物数据对生物信息工作者提出挑战,而数值刻画为我们提供一种定量研究生物数据的方法。Chou在2001年提出的伪氨基酸组成(PseAAC)概念迅速在蛋白质组学中得到应用,并于近年被推广到核酸序列。聚焦于PseAAC的... 随着生命科学的发展,海量的生物数据对生物信息工作者提出挑战,而数值刻画为我们提供一种定量研究生物数据的方法。Chou在2001年提出的伪氨基酸组成(PseAAC)概念迅速在蛋白质组学中得到应用,并于近年被推广到核酸序列。聚焦于PseAAC的数学形式,本文对其产生和发展进行简要梳理,然后着重介绍我们提出的一种广义PseAAC。 展开更多
关键词 数值刻画 伪氨基酸组成 耦合模式函数 序相关因子
下载PDF
基于修正的伪氨基酸组成预测水解酶亚家族的研究
10
作者 张光亚 邱沛然 +1 位作者 葛慧华 方柏山 《计算机与应用化学》 CAS CSCD 北大核心 2009年第5期557-560,共4页
从序列出发预测水解酶亚家族类型具有重要意义。本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型。选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%... 从序列出发预测水解酶亚家族类型具有重要意义。本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型。选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%。其中以Z标度的伪氨基酸组成效果最佳,比氨基酸组成识别精度提高12.85%。本文研究结果说明从序列出发,预测水解酶亚家族是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值的方法。 展开更多
关键词 特征值提取 水解酶 修正的伪氨基酸组成 K-近邻
原文传递
基于伪氨基酸组成的G蛋白偶联受体超家族的识别 被引量:2
11
作者 顾全 丁永生 +1 位作者 张同亮 沈懿珍 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2010年第3期500-504,共5页
G蛋白偶联受体(GPCRs)是人体内最大的蛋白质受体家族,在制药业中起到很大作用。G蛋白偶联受体的功能和其超家族、子家族的分类密切相关,然而目前其空间结构却很难用实验方法获得。因此,如何用计算的方法预测G蛋白偶联受体的家族和超家... G蛋白偶联受体(GPCRs)是人体内最大的蛋白质受体家族,在制药业中起到很大作用。G蛋白偶联受体的功能和其超家族、子家族的分类密切相关,然而目前其空间结构却很难用实验方法获得。因此,如何用计算的方法预测G蛋白偶联受体的家族和超家族是生物信息学和蛋白质科学中重要的研究内容。根据Chou提出的伪氨基酸离散模型框架,使用近似熵的概念表示G蛋白序列附加特征,构造一种新的蛋白序列表示方法。采用FKNN(模糊K近邻)分类器作为预测工具,从最新的G蛋白数据抽取全部数据,经过去除同源性处理后,构成低同源性的新测试数据集。Jackknife测试结果验证了此方法的有效性。与之前的研究结果相比,取得了最高的预测精度。结果表明,此方法处理G蛋白偶联受体有很高的实用价值。 展开更多
关键词 G蛋白偶联受体 低同源性 伪氨基酸组成 近似熵 FKNN分类器
原文传递
基于改进伪氨基酸组成的蛋白质相互作用预测 被引量:2
12
作者 许传轲 陈月辉 赵亚欧 《山东大学学报(理学版)》 CAS CSCD 北大核心 2009年第9期17-21,共5页
提出了一种新的基于改进的伪氨基酸组成特征模型与随机森林的蛋白质相互作用预测方法。首先利用基于Geary自相关函数的伪氨基酸组成特征模型,对与蛋白质相互作用相关的氨基酸属性进行评价,然后根据评价结果选择相关的属性整合到基于Mink... 提出了一种新的基于改进的伪氨基酸组成特征模型与随机森林的蛋白质相互作用预测方法。首先利用基于Geary自相关函数的伪氨基酸组成特征模型,对与蛋白质相互作用相关的氨基酸属性进行评价,然后根据评价结果选择相关的属性整合到基于Minkowski距离的伪氨基酸特征模型中,并使用随机森林作为分类器进行学习和预测,实验结果表明该方法相对于传统方法提高了正确率。 展开更多
关键词 蛋白质相互作用 伪氨基酸组成 随机森林
原文传递
从氨基酸序列预测蛋白质折叠速率 被引量:3
13
作者 郭建秀 饶妮妮 +2 位作者 刘广雄 李杰 王云鹤 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2010年第12期1331-1338,共8页
蛋白质折叠速率预测是当今生物物理学最具挑战性的课题之一.近年来,许多科研工作者开展了大量的研究工作来探索折叠速率的决定因素,许多参数和方法被相继提出.但氨基酸残基间的相互作用、氨基酸的序列顺序等信息对折叠速率的影响从未被... 蛋白质折叠速率预测是当今生物物理学最具挑战性的课题之一.近年来,许多科研工作者开展了大量的研究工作来探索折叠速率的决定因素,许多参数和方法被相继提出.但氨基酸残基间的相互作用、氨基酸的序列顺序等信息对折叠速率的影响从未被提及.采用伪氨基酸组成的方法提取氨基酸的序列顺序信息,利用蒙特卡洛方法选择最佳特征因子,建立线性回归模型进行折叠速率预测.该方法能在不需要任何(显示)结构信息的情况下,直接从蛋白质的氨基酸序列出发对折叠速率进行预测.在Jackknife交互检验方法的验证下,对含有99个蛋白质的数据集,发现折叠速率的预测值与实验值有很好的相关性,相关系数能达到0.81,预测误差仅为2.54.这一精度明显优于其他基于序列的方法,充分说明蛋白质的序列顺序信息是影响蛋白质折叠速率的重要因素. 展开更多
关键词 蛋白质折叠 折叠速率预测 伪氨基酸组成 蒙特卡罗方法
下载PDF
使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位 被引量:2
14
作者 魏蓉 赵艳君 +1 位作者 张同亮 顾全 《计算机与应用化学》 CAS CSCD 北大核心 2009年第7期921-924,共4页
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容。基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征。将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位... 预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容。基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征。将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度。结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具。以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据。3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用。有望发展成为亚细胞定位研究的有用工具。 展开更多
关键词 凋谢蛋白质亚细胞定位 伪氨基酸组成 近似熵 集成分类器 模糊K近邻分类器
原文传递
基于神经网络的蛋白质三级结构预测 被引量:12
15
作者 蔡娜娜 陈月辉 李伟 《计算机工程》 CAS CSCD 北大核心 2010年第9期176-177,共2页
在伪氨基酸组成中加入与序列相关的影响因子能够提高蛋白质三级结构预测的准确率。将伪氨基酸组成的特征作为神经网络的输入,建立分类预测模型。选用粒子群优化算法对神经网络的参数进行优化。分类方法采用一对多的二分类方法。数据集选... 在伪氨基酸组成中加入与序列相关的影响因子能够提高蛋白质三级结构预测的准确率。将伪氨基酸组成的特征作为神经网络的输入,建立分类预测模型。选用粒子群优化算法对神经网络的参数进行优化。分类方法采用一对多的二分类方法。数据集选用Chou提出的204条蛋白质。实验结果使用Jackknife交叉验证,表明该方法能提高预测准确率。 展开更多
关键词 伪氨基酸组成 粒子群优化算法 Jackknife交叉验证
下载PDF
基于自相关系数和PseAAC的蛋白质结构类预测 被引量:4
16
作者 张燕平 查永亮 +1 位作者 赵姝 杜秀全 《计算机科学与探索》 CSCD 2014年第1期103-110,共8页
传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在C... 传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在Chou提出的伪氨基酸组成模型(pseudo-amino acid composition,PseAAC)的基础上,通过扩展信息重新构造了伪氨基酸组成模型,并将其与自相关系数组合在一起来构造特征向量。分别使用两种方法编码,选用支持向量机作为预测工具,在数据集Z277、Z498以及独立测试集D138上进行了若干实验,对比结果显示,新方法比传统的氨基酸组成方法的准确率分别平均提高了7.43%和8.53%,证明了新方法是有效的。 展开更多
关键词 蛋白质结构类预测 自相关系数 伪氨基酸组成(PseAAC) 支持向量机(SVM)
下载PDF
利用BP神经网络预测蛋白质三级结构
17
作者 蔡娜娜 陈月辉 李伟 《济南大学学报(自然科学版)》 CAS 北大核心 2009年第4期331-333,共3页
在已知的蛋白质结构研究方法基础上,提出将多分类问题转化成一对多的二分类问题,来预测蛋白质的未知结构。训练多个单分类器进行分类;选用后向传播(Back Propagation,BP)神经网络作为分类预测模型;以伪氨基酸作为网络输入特征;选用Chou... 在已知的蛋白质结构研究方法基础上,提出将多分类问题转化成一对多的二分类问题,来预测蛋白质的未知结构。训练多个单分类器进行分类;选用后向传播(Back Propagation,BP)神经网络作为分类预测模型;以伪氨基酸作为网络输入特征;选用Chou提出的蛋白质数据集;实验数据采用全交叉验证(Jackknife)。结果表明:此法能够提高蛋白质三级结构预测的准确率。 展开更多
关键词 后向传播神经网络 伪氨基酸组成 全面交叉验证
下载PDF
基于柔性神经树的蛋白质结构预测 被引量:2
18
作者 黄秀 陈月辉 曹毅 《计算机工程》 CAS CSCD 北大核心 2011年第1期159-160,163,共3页
提出一种基于柔性神经树的蛋白质结构预测方法,将近似熵和蛋白质序列的疏水特性作为伪氨基酸组成的特征。对数据集中的每一条蛋白质进行特征提取。对于一个蛋白质样本,用一个27-D伪氨基酸组成作为其特征,伪氨基酸组成特征作为输入数据,... 提出一种基于柔性神经树的蛋白质结构预测方法,将近似熵和蛋白质序列的疏水特性作为伪氨基酸组成的特征。对数据集中的每一条蛋白质进行特征提取。对于一个蛋白质样本,用一个27-D伪氨基酸组成作为其特征,伪氨基酸组成特征作为输入数据,柔性神经树作为预测工具,分类方法采用M-ary方法,数据集选用640数据集。仿真结果表明,该方法具有较好的优化性能,提高了预测的准确率。 展开更多
关键词 蛋白质结构分类 伪氨基酸组成 近似熵 疏水性 柔性神经树
下载PDF
PCA方法在蛋白质亚细胞定位中应用 被引量:1
19
作者 马军伟 史舵 +1 位作者 顾宏 张杰 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第3期426-430,共5页
蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映... 蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映序列次序效应的最优λ值.首先让λ取最大以包含尽可能多的序列次序信息,然后利用主成分分析法提取关键主特征.实验结果表明此方法能解决确定最优λ值困难的问题,且性能优于已有的预测工具. 展开更多
关键词 蛋白质亚细胞定位 主成分分析 伪氨基酸组成 K近邻分类器 BP神经网络
下载PDF
基于多视角特征融合与随机森林的蛋白质结晶预测 被引量:2
20
作者 李强 郑宇杰 《现代电子技术》 北大核心 2015年第8期50-53,共4页
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费... X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(Pse AAC)和伪位置特异性得分矩阵特征(Pse PSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。 展开更多
关键词 蛋白质结晶 伪氨基酸组成 位置特异性得分矩阵 随机森林
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部