期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于自相关系数和PseAAC的蛋白质结构类预测 被引量:4
1
作者 张燕平 查永亮 +1 位作者 赵姝 杜秀全 《计算机科学与探索》 CSCD 2014年第1期103-110,共8页
传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在C... 传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在Chou提出的伪氨基酸组成模型(pseudo-amino acid composition,PseAAC)的基础上,通过扩展信息重新构造了伪氨基酸组成模型,并将其与自相关系数组合在一起来构造特征向量。分别使用两种方法编码,选用支持向量机作为预测工具,在数据集Z277、Z498以及独立测试集D138上进行了若干实验,对比结果显示,新方法比传统的氨基酸组成方法的准确率分别平均提高了7.43%和8.53%,证明了新方法是有效的。 展开更多
关键词 蛋白质结构类预测 自相关系数 伪氨基酸组成(PseAAC) 支持向量机(SVM)
下载PDF
基于二叉树支持向量机的蛋白质结构类预测 被引量:1
2
作者 张同亮 丁永生 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2008年第4期921-924,共4页
提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和... 提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和n折叠交叉验证方法测试了新方法的性能。预测结果表明新方法具有良好的预测能力,与使用同一数据集的已有结果相比较,新方法的Jackknife结果和目前最好的方法取得的结果相当,可作为蛋白质结构类预测的一个工具。 展开更多
关键词 蛋白质结构类预测 二叉树支持向量机 氨基酸对相互作用 疏水模式
下载PDF
基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测 被引量:1
3
作者 郑斌 厉力华 《中国生物医学工程学报》 CAS CSCD 北大核心 2013年第5期580-587,共8页
蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维... 蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法。该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息。实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%。与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率。 展开更多
关键词 蛋白质结构类预测 特征信息集 Ma-Ada多分器融合
下载PDF
一种新的蛋白质结构类预测方法
4
作者 李楠 李春 《生物信息学》 2012年第4期238-240,共3页
基于氨基酸的16种分类模型,给出蛋白质序列的派生序列,进而结合加权拟熵和LZ复杂度构造出34维特征向量来表示蛋白质序列。借助于贝叶斯分类器对同源性不超过25%的640数据集进行蛋白质结构类预测,准确度达到71.28%。
关键词 蛋白质结构类预测 氨基酸 加权拟熵 LZ复杂度 贝叶斯分
下载PDF
基于蛋白质二级结构内容的域结构类预测(英文)
5
作者 闫化军 章毅 《生物信息学》 2004年第4期19-24,41,共7页
运用加入竞争层的BP网络 ,研究了基于蛋白质二级结构内容的域结构类预测问题。在BP网络中嵌入一竞争 ,层显著提高了网络预测性能。仅使用了一个小的训练集和简单的网络结构 ,获得了很高的预测精度 :自支持精度 97 6 2 % ,jack -knife测... 运用加入竞争层的BP网络 ,研究了基于蛋白质二级结构内容的域结构类预测问题。在BP网络中嵌入一竞争 ,层显著提高了网络预测性能。仅使用了一个小的训练集和简单的网络结构 ,获得了很高的预测精度 :自支持精度 97 6 2 % ,jack -knife测试精度 97 6 2 % ,及平均外推精度 90 74 %。在建立更完备的域结构类特征向量和更有代表性的训练集的基础上 ,所述方法将为蛋白质域结构分类领域提供新的分类基准。 展开更多
关键词 蛋白质结构 结构类预测 BP神经网络 竞争层
下载PDF
使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类 被引量:2
6
作者 姜小莹 朱俊东 +1 位作者 李晓波 张同亮 《生物物理学报》 CAS CSCD 北大核心 2008年第1期43-48,共6页
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)... 蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具。 展开更多
关键词 蛋白质结构类预测 伪氨基酸组成 模糊支持向量机 遗传算法
下载PDF
新型核序列自相关函数用于非同源蛋白质结构类预测
7
作者 金宏 周鹏 商志才 《计算机与应用化学》 CAS CSCD 北大核心 2011年第1期61-68,共8页
从天然氨基酸的50个性质参数中经主成分分析得出1种新的氨基酸描述子:氨基酸特征性质得分。并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了1种新的蛋白质序列表征方法:... 从天然氨基酸的50个性质参数中经主成分分析得出1种新的氨基酸描述子:氨基酸特征性质得分。并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了1种新的蛋白质序列表征方法:核序列自相关函数。采用该函数对632个已知晶体结构的非同源蛋白分类研究结果表明:KSACF能够恰当提取蛋白质一级序列特征以及氨基酸残基之间隐含的内在联系,从而对不同蛋白质结构类进行准确预测。 展开更多
关键词 核序列自相关函数 氨基酸特征性质得分 蛋白质结构类预测
原文传递
基于最大熵模型预测蛋白质结构的分类 被引量:3
8
作者 姜小莹 魏蓉 +1 位作者 董彩霞 李晓波 《计算机与应用化学》 CAS CSCD 北大核心 2007年第11期1532-1534,共3页
基于最大熵模型,构建一种简单的预测蛋白质序列结构分类的算法。不同性质的氨基酸组合,在特定结构的蛋白质二级结构中,出现的频率不同,通过在模体数据库Prosite中查找蛋白质序列匹配的模体,以10种氨基酸组合在序列中出现的频率,表示蛋... 基于最大熵模型,构建一种简单的预测蛋白质序列结构分类的算法。不同性质的氨基酸组合,在特定结构的蛋白质二级结构中,出现的频率不同,通过在模体数据库Prosite中查找蛋白质序列匹配的模体,以10种氨基酸组合在序列中出现的频率,表示蛋白质序列的特征,构建相应的结构分类预测模型。最大熵模型用来确定蛋白质结构分类预测模型的参数。以自身一致性和Jackknife测试方法验证分类模型的准确性。结果表明新构建的方法简单、准确,综合性能优于一般的预测方法。 展开更多
关键词 蛋白质 结构类预测 最大熵模型 模体
原文传递
SIMCA法用于从非同源蛋白一级序列预测其结构类 被引量:1
9
作者 高守国 《计算机与应用化学》 CAS CSCD 北大核心 2004年第5期714-716,共3页
蛋白质结构类的正确识别对于其三级结构预测具有十分重要的意义,有必要引入先进的算法提高预测精度。使用SIM-CA 法处理氨基酸组成、自相关系数提取的特征参数以及氨基酸对含量,进行了蛋白质结构类的预测。采用Miyazawa 和Jerni-gan 的... 蛋白质结构类的正确识别对于其三级结构预测具有十分重要的意义,有必要引入先进的算法提高预测精度。使用SIM-CA 法处理氨基酸组成、自相关系数提取的特征参数以及氨基酸对含量,进行了蛋白质结构类的预测。采用Miyazawa 和Jerni-gan 的疏水值时,All-α、All-β、αβ类的自检验的精度为89%、91%、89%,它检验的精度分别为74%、87%、91%;引入氨基酸对含量后,All-α、All-β、αβ类自检验精度为86%、89%、90%,它检验的精度为77%、88%、93%。SIMCA 的预测结果好于Bayes-ian 识别函数法,氨基酸对的引入可以提高预测精度。 展开更多
关键词 结构类预测 SIMCA 氨基酸对含量
原文传递
氨基酸序列的特征描述 被引量:4
10
作者 靳利霞 唐焕文 《计算机与应用化学》 CAS CSCD 北大核心 2003年第1期1-5,共5页
氨基酸序列的特征描述是指从一条氨基酸序列选取相关的特征信息并用数学方法描述这些信息,使之能正确反映序列与结构或功能之间的关系。在根据氨基酸序列预测蛋白质的结构类或亚细胞位置等问题中,氨基酸序列的特征描述直接影响预测质量... 氨基酸序列的特征描述是指从一条氨基酸序列选取相关的特征信息并用数学方法描述这些信息,使之能正确反映序列与结构或功能之间的关系。在根据氨基酸序列预测蛋白质的结构类或亚细胞位置等问题中,氨基酸序列的特征描述直接影响预测质量;同时比较不同描述方法对预测结果的影响可以帮助我们理解序列与结构或序列与功能之间的关系。本文介绍了几种氨基酸序列的特征描述方法,以FDOD方程作为判别函数,比较了其中几种描述方法对蛋白质结构类预测结果的影响,发现二级结构单纯的全α类和全β类蛋白质对于氨基酸组成比较敏感,而对于混合型蛋白质,即α+β类和α/β类蛋白质,考虑氨基酸残基排列顺序可以显著提高预测结果。 展开更多
关键词 氨基酸序列 氨基酸组成 特征描述 结构类预测 亚细胞定位
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部