期刊文献+
共找到396篇文章
< 1 2 20 >
每页显示 20 50 100
基于语言模型的蛋白质结构域边界预测方法
1
作者 张贵军 汪乾梁 彭春祥 《浙江工业大学学报》 CAS 北大核心 2024年第5期521-529,共9页
蛋白质结构域对于蛋白质结构和功能研究具有重要意义。针对目前从头预测蛋白质结构域的方法普遍存在精度不高、耗费资源多等问题,提出了一种基于语言模型的蛋白质结构域边界预测方法DomTransformer,该方法基于蛋白质结构分类数据库(CATH... 蛋白质结构域对于蛋白质结构和功能研究具有重要意义。针对目前从头预测蛋白质结构域的方法普遍存在精度不高、耗费资源多等问题,提出了一种基于语言模型的蛋白质结构域边界预测方法DomTransformer,该方法基于蛋白质结构分类数据库(CATH)、蛋白质结构预测关键评估(CASP)竞赛数据,以及在AFDB(AlphaFold protein structure database)基础上建立的域数据库等共同构建数据集,搭建了基于Transformer网络架构和稀疏多头自注意力机制的网络模型,引入了新的特征、接触数和域级MSA(Domain multiple sequence alignment),通过直接预测结构域边界来解决数据不平衡等问题。在独立测试集上的测试结果表明了DomTransformer的有效性。 展开更多
关键词 蛋白质结构 语言模型 从头预测
下载PDF
河海图结构蛋白质数据集及预测模型
2
作者 魏想想 孟朝晖 《计算机科学》 CSCD 北大核心 2024年第8期117-123,共7页
蛋白质是一种具有空间结构的物质。蛋白质结构预测的主要目标是从已有的大规模的蛋白质数据集中提取有效的信息,从而预测自然界中蛋白质的结构。目前蛋白质结构预测实验存在的一个问题是,缺少能够进一步反映出蛋白质空间结构特征的数据... 蛋白质是一种具有空间结构的物质。蛋白质结构预测的主要目标是从已有的大规模的蛋白质数据集中提取有效的信息,从而预测自然界中蛋白质的结构。目前蛋白质结构预测实验存在的一个问题是,缺少能够进一步反映出蛋白质空间结构特征的数据集。当前主流的PDB蛋白质数据集虽然是经过实验测得,但没有利用到蛋白质的空间特征,而且存在掺杂核酸数据和部分数据不完整的问题。针对以上问题,从蛋白质的空间结构角度来研究蛋白质的预测。在原始PDB数据集的基础上,提出了河海图结构蛋白质数据集(Hohai Graphic Protein Data Bank,HohaiGPDB)。该数据集以图结构为基础,表达出了蛋白质的空间结构特征。基于传统Transformer网络模型对新的数据集进行了相关的蛋白质结构预测实验,在HohaiGPDB数据集上的预测准确率可以达到59.38%,证明了HohaiGPDB数据集的研究价值。HohaiGPDB数据集可以作为蛋白质相关研究的通用数据集。 展开更多
关键词 河海图结构蛋白质数据集 蛋白质空间结构 蛋白质结构预测 Transformer模型
下载PDF
基于云计算的蛋白质折叠空间结构预测
3
作者 徐胜超 杨波 +3 位作者 王宏杰 毛明扬 蒋金陵 蒋大锐 《电子技术应用》 2024年第8期10-16,共7页
构建基于云计算的蛋白质折叠空间结构预测框架,通过数据云存储设备获取蛋白质序列原始数据,采用HDFS(Hadoop Distributed File System)分布式存储方式保存于云端。资源和队列管理器RQM(Resource Queue Man‐agement)开启云端虚拟机后,... 构建基于云计算的蛋白质折叠空间结构预测框架,通过数据云存储设备获取蛋白质序列原始数据,采用HDFS(Hadoop Distributed File System)分布式存储方式保存于云端。资源和队列管理器RQM(Resource Queue Man‐agement)开启云端虚拟机后,以之作为扫描节点(Sensor Node,SN),SN基于二维AB非格点模型建立最小蛋白质分子能量优化函数,采用局部搜索机制改进的量子遗传算法对其作优化求解。利用云端GPU设备处理模型训练数据,即可实现蛋白质折叠空间结构的自动化预测。实验结果表明:蛋白质序列能量势函数计算结果更小、执行效率更高、GDT-TS(Geothermal Development and Testing Tool Suite)评价指标值更大。 展开更多
关键词 云计算 蛋白质折叠 空间结构预测 HDFS分布式存储 局部搜索机制 量子遗传算法
下载PDF
结构类似模板增强的端到端多域蛋白质组装方法
4
作者 朱海涛 夏瑜豪 张贵军 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1825-1831,共7页
使用同源模板能够有效的提升蛋白质结构预测的精度,然而,对于部分多域蛋白,PDB中可用的同源模板较少,这可能会影响预测精度.为了进一步提高多域蛋白质的建模精度,本文提出了基于结构类似模板结合同源模板的端到端多域组装方法MTDA.首先... 使用同源模板能够有效的提升蛋白质结构预测的精度,然而,对于部分多域蛋白,PDB中可用的同源模板较少,这可能会影响预测精度.为了进一步提高多域蛋白质的建模精度,本文提出了基于结构类似模板结合同源模板的端到端多域组装方法MTDA.首先,搜索序列数据库生成多序列比对,以及分别搜索PDB100和MPDB生成同源模板和结构类似模板;进而提取序列特征、模板特征和单域特征;然后通过一个基于EfficientNetV2架构和注意力机制相结合的神经网络来预测多域蛋白质的域间方位从而直接将多个单域结构组装为全链结构.在125个测试蛋白和65个人类蛋白上的实验结果表明,MTDA优于仅使用同源模板的端到端组装方法E2EDA以及全链建模方法AlphaFold2. 展开更多
关键词 多域蛋白质 模板建模 深度学习 结构域组装 域间方位预测
下载PDF
蛋白质结构域边界网络流预测方法 被引量:1
5
作者 余众泽 彭春祥 张贵军 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1892-1897,共6页
结构域边界预测是蛋白质结构和功能研究的重要问题.针对目前大多数结构域边界预测方法精度低的局限性,提出一种基于网络流的蛋白质结构域边界预测算法GraphDom.该算法将蛋白质结构域边界预测问题转化为网络流分割问题,根据设计的边容量... 结构域边界预测是蛋白质结构和功能研究的重要问题.针对目前大多数结构域边界预测方法精度低的局限性,提出一种基于网络流的蛋白质结构域边界预测算法GraphDom.该算法将蛋白质结构域边界预测问题转化为网络流分割问题,根据设计的边容量公式将预测的残基接触距离转换为蛋白质容量图,通过Ford-Fulkerson算法得到蛋白质剩余容量图,并使用深度优先算法和回溯算法获得强连接分量图并枚举所有可行的最小切割,最后基于结构域的一般特性设计域边界评估函数来评估划分的区域,并决定是否继续递归划分.在120个非冗余测试蛋白上与3种主流方法相比,显示了GraphDom的有效性. 展开更多
关键词 蛋白质结构 结构域边界预测 网络流 接触距离
下载PDF
蛋白质结构预测进展 被引量:3
6
作者 曹卫 潘宪明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2023年第5期1190-1194,共5页
蛋白质的序列决定结构,结构决定功能。新一代准确的蛋白质结构预测工具为结构生物学、结构生物信息学、药物研发和生命科学等许多领域带来了全新的机遇与挑战,单链蛋白质结构预测的准确率达到与试验方法相媲美的水平。本综述概述了蛋白... 蛋白质的序列决定结构,结构决定功能。新一代准确的蛋白质结构预测工具为结构生物学、结构生物信息学、药物研发和生命科学等许多领域带来了全新的机遇与挑战,单链蛋白质结构预测的准确率达到与试验方法相媲美的水平。本综述概述了蛋白质结构预测领域的理论基础、发展历程与最新进展,讨论了大量预测的蛋白质结构和基于人工智能的方法如何影响实验结构生物学,最后,分析了当前蛋白质结构预测领域仍未解决的问题以及未来的研究方向。 展开更多
关键词 蛋白质结构预测 深度学习 能量函数
下载PDF
蛋白质复合物结构预测:方法与进展 被引量:2
7
作者 黄鹤 吴桐 +4 位作者 王闻达 李佳珊 孙黛雯 叶启威 龚新奇 《合成生物学》 CSCD 2023年第3期507-523,共17页
蛋白质复合物是不同蛋白质链通过相互作用形成的,自然界中很多蛋白质通过形成复合物而执行功能,因此准确地预测复合物的结构对于理解和掌握功能至关重要。近两年来,单条蛋白质链的结构预测有了突破性的进展,从氨基酸序列出发预测蛋白质... 蛋白质复合物是不同蛋白质链通过相互作用形成的,自然界中很多蛋白质通过形成复合物而执行功能,因此准确地预测复合物的结构对于理解和掌握功能至关重要。近两年来,单条蛋白质链的结构预测有了突破性的进展,从氨基酸序列出发预测蛋白质结构的水平大幅提高。但相较于单体蛋白质,蛋白质复合物结构预测的准确性仍然较低。本文旨在总结蛋白质复合物结构预测的相关算法以及介绍最新进展。首先简要介绍蛋白质结构预测领域的相关人工智能算法,主要包括共进化分析与蛋白质接触预测、深度学习方法与蛋白质结构预测、预训练模型与蛋白质表征学习几个方面;其次系统总结了蛋白质复合物链间相互作用预测的基本方法,从复合物的多重序列比对构建到对于同源或异源复合物的链间残基接触预测;最后从相互作用位点指导复合物结构预测、蛋白质分子对接算法、端到端的复合物结构预测方法等方面阐述了蛋白质复合物结构预测的基本方法和思路。总体来说,目前蛋白质复合物结构预测精度不够高,有效地解决多重序列比对的配对和多聚体复合物模板搜索等问题,或者在大量的序列或结构数据上结合预训练模型的新范式,是一个合理而有效的方案。提升蛋白质复合物结构预测水平在合成生物学领域如抗体设计、药物发现等方面有很好的应用前景。 展开更多
关键词 蛋白质复合物 蛋白质相互作用 蛋白质链间接触预测 蛋白质分子对接 结构预测
下载PDF
基于Wasserstein生成对抗网络和残差网络的8类蛋白质二级结构预测
8
作者 李舜 马玉明 刘毅慧 《计算生物学》 CAS 2023年第1期1-9,共9页
蛋白质二级结构包含充分的蛋白质信息,而且蛋白质二级结构是研究蛋白质三级结构和药物设计的基础,因此,本文提出了一种基于Wasserstein生成对抗网络(WGAN)和残差网络(ResNet)的蛋白质8态二级结构预测的方法。该方法首先通过Wasserstein... 蛋白质二级结构包含充分的蛋白质信息,而且蛋白质二级结构是研究蛋白质三级结构和药物设计的基础,因此,本文提出了一种基于Wasserstein生成对抗网络(WGAN)和残差网络(ResNet)的蛋白质8态二级结构预测的方法。该方法首先通过Wasserstein生成对抗网络(WGAN)提取蛋白质特征,将其与PSSM结合成新的特征集合,然后将新的特征集合输入到残差网络(ResNet)预测并得到最终结果。经过实验,该方法在测试集CASP10-14和CB513中的Q8预测准确率分别为73.21%,72.43%,71.67%,69.83%,70.17%和73.89%。通过实验表明,Wasserstein生成对抗网络(WGAN)具有出色的特征提取能力,ResNet能够有效地训练深层网络结构,从而提高蛋白质二级结构的预测精度。 展开更多
关键词 生成对抗网络 残差网络 蛋白质二级结构 特征提取 深层网络 二级结构预测 预测准确率 药物设计
下载PDF
基于自注意力机制和GAN的蛋白质二级结构预测
9
作者 杨璐 董洪伟 《中国科技论文在线精品论文》 2023年第2期148-159,共12页
蛋白质二级结构预测是蛋白质组计划中的一个重要组成部分,为提高蛋白质二级结构的预测准确率,同时减小训练规模,提出了一种基于自注意力生成对抗网络(Self-Attention generative adversarial network,SA-GAN)的深度学习模型。该模型利... 蛋白质二级结构预测是蛋白质组计划中的一个重要组成部分,为提高蛋白质二级结构的预测准确率,同时减小训练规模,提出了一种基于自注意力生成对抗网络(Self-Attention generative adversarial network,SA-GAN)的深度学习模型。该模型利用生成对抗网络(generative adversarial network,GAN)提取隐式特征,其次将提取的特征结果与蛋白质序列的位置特异性矩阵(position specific scoring matrix,PSSM)结合作为网络的输入,其中,自注意力模块与卷积增强的GAN共同作用,得到预测结果。在测试数据集CASP10,CASP11,CASP12,CASP13,CASP14和CB513上分别获得了83.93%,83.61%,84.13%,84.86%,84.02%和83.37%的Q3准确率。实验结果表明,SA-GAN模型对于提取生物序列特征、获取长程依赖全局信息和提高蛋白质二级结构预测准确率的作用十分显著,具有较强的表达能力和竞争力。 展开更多
关键词 人工智能 蛋白质二级结构预测 卷积神经网络(CNN) 生成对抗网络(GAN) 自注意力机制
下载PDF
蛋白质计算中的机器学习 被引量:1
10
作者 张嘉晖 《物理学报》 SCIE EI CAS CSCD 北大核心 2024年第6期95-107,共13页
蛋白质计算一直以来都是科学领域中的重要课题,而近年来其与机器学习的结合,更是极大地推进了相关学科的发展.本综述主要讨论了机器学习在四个重要的蛋白质计算领域内的研究进展,这四个领域包括:分子动力学模拟、结构预测、性质预测和... 蛋白质计算一直以来都是科学领域中的重要课题,而近年来其与机器学习的结合,更是极大地推进了相关学科的发展.本综述主要讨论了机器学习在四个重要的蛋白质计算领域内的研究进展,这四个领域包括:分子动力学模拟、结构预测、性质预测和分子设计.分子动力学模拟依赖于力场参数,准确的力场参数是分子动力学模拟的必需品,而机器学习可以帮助研究者得到更加准确的力场参数.在分子动力学模拟中,机器学习也可以从复杂的体系中以较小的代价计算出所需求解的自由能.结构预测一般是给定蛋白质序列预测其结构.结构预测复杂度高、数据量大,而这恰恰是机器学习所擅长的.在机器学习的协助下,近年来科研人员已经在单个蛋白质三维结构预测上取得了不错的成果.性质预测则是指通过给定的已知蛋白质信息,推断其可能拥有的性质,这对于蛋白质的研究也是至关重要的.更具挑战性的是分子设计,虽然近年来机器学习在蛋白质设计上取得突破,但这一领域还有很大空间值得探索.本综述将针对以上四点分别展开论述,并对蛋白质计算中的机器学习研究进行展望. 展开更多
关键词 蛋白质 机器学习 分子动力学模拟 结构预测 性质预测 分子设计
下载PDF
用于真实蛋白质结构预测的一种新的优化方法 被引量:9
11
作者 卢本卓 王存新 王宝翰 《Chinese Journal of Chemical Physics》 SCIE CAS CSCD 北大核心 2003年第2期117-121,共5页
用“相对熵”作为优化函数 ,提出了一个有效快速的折叠预测优化算法 .使用了非格点模型 ,预测只关心蛋白质主链的走向 .其中只用到了蛋白质主链上的两两连续的Cα 原子间的距离信息以及 2 0种氨基酸的接触势的一个扩展形式 .对几个真实... 用“相对熵”作为优化函数 ,提出了一个有效快速的折叠预测优化算法 .使用了非格点模型 ,预测只关心蛋白质主链的走向 .其中只用到了蛋白质主链上的两两连续的Cα 原子间的距离信息以及 2 0种氨基酸的接触势的一个扩展形式 .对几个真实蛋白质做了算法测试 ,预测的初始结构都为比较大的去折叠态 ,预测构象相对于它们天然结构的均方根偏差 (RMSD)为 5~ 7 .从原理上讲 ,该方法是对能量优化的改进 . 展开更多
关键词 蛋白质 结构预测 折叠预测 相对熵 优化方法 非格点模型 三级结构 氨基酸序列
下载PDF
蛋白质结构预测 被引量:21
12
作者 邓海游 贾亚 张阳 《物理学报》 SCIE EI CAS CSCD 北大核心 2016年第17期169-179,共11页
从氨基酸序列出发预测蛋白质的三维结构是目前计算生物学和生物物理学领域最具挑战性和影响力的研究方向之一.本文从结构预测的研究背景出发,简要介绍了它的理论意义、应用需求及基本现状;并根据结构预测的一般步骤,依次介绍了构象初始... 从氨基酸序列出发预测蛋白质的三维结构是目前计算生物学和生物物理学领域最具挑战性和影响力的研究方向之一.本文从结构预测的研究背景出发,简要介绍了它的理论意义、应用需求及基本现状;并根据结构预测的一般步骤,依次介绍了构象初始化、构象搜索、结构筛选、全原子结构重建、结构优化等基本预测过程;随后分基于模板和无模板两类,各列举了几种具有代表性的结构预测方法;最后对该领域的盛事——国际蛋白质结构预测技术评估大赛(CASP)做了简单介绍. 展开更多
关键词 蛋白质结构预测 同源建模 从头预测 结构优化
下载PDF
蛋白质三级结构预测算法综述 被引量:13
13
作者 王超 朱建伟 +3 位作者 张海仓 巩海娥 郑伟谋 卜东波 《计算机学报》 EI CSCD 北大核心 2018年第4期760-779,共20页
了解蛋白质的三维结构对于认识蛋白质的功能有着重要意义.由于蛋白质结构测定的速度远远跟不上蛋白质序列测定的速度,因此使用计算技术依据蛋白质序列预测结构成为结构测定的有力补充.该文首先总结了蛋白质结构预测的3类基本方法,包括... 了解蛋白质的三维结构对于认识蛋白质的功能有着重要意义.由于蛋白质结构测定的速度远远跟不上蛋白质序列测定的速度,因此使用计算技术依据蛋白质序列预测结构成为结构测定的有力补充.该文首先总结了蛋白质结构预测的3类基本方法,包括基于序列-序列联配的同源建模法、基于序列-结构联配的归范法以及基于最小化能量函数的从头预测法,并分析了其中的关键技术;进而总结了有代表性的蛋白质结构预测软件工具,然后通过对蛋白质结构预测CASP比赛结果的分析比较了各种方法的性能,并获得了如下结论:当待预测蛋白质与模板蛋白质序列等同度超过30%时,同源建模法能够产生高质量的预测结果,归范法中的远同源检测以及从头预测法中的能量函数设计是尚待突破的关键点;最后,该文总结分析了未来的发展趋势,并阐释了强序列信号"绑架"蛋白质构象生成的观点,即从整体来说,蛋白质序列与结构的关联关系并不显著,但其中某些特定的局部序列片段具有非常强的结构倾向性,这些强信号区域引导蛋白质的折叠过程,对这些强信号区域的认识将会有助于提升蛋白质结构预测算法的性能. 展开更多
关键词 蛋白质结构 同源建模 归范法 从头预测 能量函数 动态规划 线性规划
下载PDF
应用连续小波变换预测蛋白质的二级结构 被引量:6
14
作者 邱建丁 梁汝萍 +1 位作者 邹小勇 莫金垣 《化学学报》 SCIE CAS CSCD 北大核心 2003年第5期748-754,共7页
将代码为 1gca蛋白质的氨基酸序列映射为疏水值序列 ,在合适的尺度下 ,通过连续小波变换法分别对其α螺旋 ,α螺旋和 β折叠之间的连接多肽 (即部分规则和无规则二级结构 )进行预测 ,准确率分别为 76.5 %和 85 .7% .从PDBsum数据库中随... 将代码为 1gca蛋白质的氨基酸序列映射为疏水值序列 ,在合适的尺度下 ,通过连续小波变换法分别对其α螺旋 ,α螺旋和 β折叠之间的连接多肽 (即部分规则和无规则二级结构 )进行预测 ,准确率分别为 76.5 %和 85 .7% .从PDBsum数据库中随机抽取 10 0个蛋白质作为测试对象 ,其中全α螺旋、全 β折叠、α/β以及α +β蛋白质各 2 5个 .在 10 0个蛋白质中共有 1618个连接多肽和 747个α螺旋 .本法预测到的连接多肽共有 15 3 6个 ,其中 13 0 8个与实际结构一致 ,平均预测准确率为 85 .2 % ;预测到的α螺旋有 770个 ,其中 5 81个与实际结构一致 ,平均预测准确率为 75 .5 % .结果表明 :该法可较好地预测蛋白质的α螺旋、连接多肽 。 展开更多
关键词 连续小波变换 预测 蛋白质 二级结构 多肽 疏水性
下载PDF
猪细小病毒非结构蛋白NS1基因的克隆、序列分析及蛋白质结构预测 被引量:8
15
作者 刘建 汤德元 +6 位作者 罗险峰 曾智勇 李春燕 甘振磊 王凤 郝飞 王洪光 《中国畜牧兽医》 CAS 北大核心 2013年第5期8-13,共6页
根据GenBank登录的猪细小病毒NADL-2株和China株序列,利用Oligo 6.0软件设计1对扩增NS1全基因的特异性引物,对从贵州省安顺地区检测到的PPV的NS1基因进行扩增、克隆、测序、序列分析和蛋白质结构预测分析。测序结果表明,扩增的目的基因... 根据GenBank登录的猪细小病毒NADL-2株和China株序列,利用Oligo 6.0软件设计1对扩增NS1全基因的特异性引物,对从贵州省安顺地区检测到的PPV的NS1基因进行扩增、克隆、测序、序列分析和蛋白质结构预测分析。测序结果表明,扩增的目的基因长度为1986bp,共编码659个氨基酸,其中NS1基因的1287、1288和1298位碱基发生了缺失,导致429、430和433位氨基酸发生缺失。系统发生树结果表明,本试验测序的NS1基因与NADL-2弱毒株处在同一进化分支;氨基酸同源性与NADL-2弱毒株和Kresse毒株最高,均为98.6%。蛋白质结构预测分析结果表明,非结构蛋白NS1的分子质量为75269.76u,理论等电点pI为7.25,不稳定系数为41.57,推测其为不稳定蛋白质;脂肪指数为73.58,总体平均亲水性为-0.565,推测该蛋白质是一种亲水性蛋白质;该蛋白质含有丰富的α-螺旋、β-折叠、β-转角和无规则卷曲,柔性区域较多,呈连续分布;非结构蛋白NS1无跨膜区和信号肽;预测非结构蛋白NS1含有3个N-糖基化位点、3个cAMP和cGMP依赖性蛋白激酶磷酸化位点、5个蛋白激酶C磷酸化位点、22个酪蛋白激酶Ⅱ磷酸化位点、1个酪氨酸激酶磷酸化位点、8个N-肉豆蔻酰化位点、1个酰胺化位点及1个ATP/GTP结合位点基序A(P-环);该蛋白质抗原表位较多,存在10个主要的抗原表位。 展开更多
关键词 猪细小病毒 NS1基因 克隆 序列分析 蛋白质结构预测
下载PDF
基于图的匹配方法预测蛋白质结构中的二硫键 被引量:3
16
作者 史晓红 王燕 +2 位作者 张凯 罗亮 许进 《计算机工程与应用》 CSCD 北大核心 2007年第13期30-32,75,共4页
在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构像的搜索空间,有利于蛋白质的3D结构的预测。论文将一个蛋白质结构中二硫键的预测问题,等价为一个寻找图的最大权的匹配问题。图的... 在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构像的搜索空间,有利于蛋白质的3D结构的预测。论文将一个蛋白质结构中二硫键的预测问题,等价为一个寻找图的最大权的匹配问题。图的顶点表示序列中的半胱氨酸残基,边连接每一顶点,表示一种可能的连接方式,边的权根据一个权值函数赋值,用EJ算法寻找具有最大权的匹配,则这个匹配对应二硫键的正确连接。应用这个方法对蛋白质结构的二硫键进行了预测并取得了良好的结果。 展开更多
关键词 蛋白质结构预测 二硫键 匹配
下载PDF
从非同源蛋白质的一级序列预测其结构类 被引量:8
17
作者 秦红珊 杨新岐 曹文斗 《生物物理学报》 CAS CSCD 北大核心 2002年第2期213-222,共10页
对基于氨基酸组成、自相关函数和自协方差函数提取特征参量的蛋白质结构类预测算法进行分析比较 ,对氨基酸组成和自相关函数相结合的方法 ,以及氨基酸组成和自协方差函数相结合的方法的预测算法进行了研究。结果表明 :对非同源蛋白质数... 对基于氨基酸组成、自相关函数和自协方差函数提取特征参量的蛋白质结构类预测算法进行分析比较 ,对氨基酸组成和自相关函数相结合的方法 ,以及氨基酸组成和自协方差函数相结合的方法的预测算法进行了研究。结果表明 :对非同源蛋白质数据库 ,在氨基酸组成和自相关函数相结合的方法中 ,采用Miyazawa和Jernigan的疏水值时 ,训练库的自检验的总精度为95.34% ,其Jackknife检验的总精度为81.92% ,检验库的他检验的总精度为86.61%。在氨基酸组成和自协方差函数相结合的方法中 ,采用Wold等的疏水值时 ,训练库的自检验的总精度为96.71 % ,其Jackknife检验的总精度为82.19 % ,检验库的他检验的总精度为86.88 %。这说明氨基酸组成和自相关函数相结合的方法 ,以及氨基酸组成和自协方差函数相结合的方法可有效提高结构类预测精度 。 展开更多
关键词 非同源蛋白质 一级序列 预测 结构
下载PDF
基于级联神经网络的蛋白质二级结构预测 被引量:7
18
作者 王艳春 何东健 王守志 《计算机工程》 CAS CSCD 北大核心 2010年第4期22-24,共3页
为提高蛋白质二级结构预测的精度,提出一种由两层网络构成的级联神经网络模型。第1层网络采用具有差异度的5个子网构成的网络模型,对第2层网络的输入编码进行改进。对PDBSelect25中的36条蛋白质共6122个残基进行测试,结果表明,该模型能... 为提高蛋白质二级结构预测的精度,提出一种由两层网络构成的级联神经网络模型。第1层网络采用具有差异度的5个子网构成的网络模型,对第2层网络的输入编码进行改进。对PDBSelect25中的36条蛋白质共6122个残基进行测试,结果表明,该模型能有效预测蛋白质二级结构,其预测精度分别比SNN,DSC,PREDSATOR方法提高5.31%,1.21%和0.92%,平均预测精度提高到69.61%。 展开更多
关键词 神经网络 蛋白质 二级结构预测
下载PDF
蛋白质结构预测的优化模型与方法 被引量:6
19
作者 唐焕文 靳利霞 计明军 《工程数学学报》 CSCD 北大核心 2002年第2期13-22,共10页
从头预测方法是一种主要的蛋白质空间结构预测方法 ,其核心内容是恰当地建立并求解一个复杂的全局优化问题。 4 0年来 ,虽然也取得了许多研究成果 ,但该问题的研究始终没有克服两个方面的困难 ,即如何找到一个表征蛋白质结构与能量关系... 从头预测方法是一种主要的蛋白质空间结构预测方法 ,其核心内容是恰当地建立并求解一个复杂的全局优化问题。 4 0年来 ,虽然也取得了许多研究成果 ,但该问题的研究始终没有克服两个方面的困难 ,即如何找到一个表征蛋白质结构与能量关系的势能函数和一种有效的全局优化方法。主要介绍了蛋白质结构预测的优化模型和方法。 展开更多
关键词 蛋白质结构 预测 优化模型 从头预测 势能函数 能量极小化 橡象搜索 全局优化
下载PDF
求解蛋白质结构预测问题的二维连续模型及其相应的拟物算法 被引量:7
20
作者 黄文奇 黄勤波 石赫 《计算机研究与发展》 EI CSCD 北大核心 2004年第11期1959-1965,共7页
研究了生物信息学中的一个重要问题 ,即蛋白质结构预测 受物理世界的物体间相互作用的规律的启发 ,给出了该问题一个二维欧氏空间连续模型 它比离散模型有一定的优越性 ,此模型的优点可能在于让计算很自然地利用到了一个客观存在的“天... 研究了生物信息学中的一个重要问题 ,即蛋白质结构预测 受物理世界的物体间相互作用的规律的启发 ,给出了该问题一个二维欧氏空间连续模型 它比离散模型有一定的优越性 ,此模型的优点可能在于让计算很自然地利用到了一个客观存在的“天然导引” ,这个“天然导引”即是疏水氨基酸之间的引力 ,从而在构形优度相当的前提下 ,连续模型有助于计算速度的提高 然后根据这个连续模型找到了相应的拟物算法 ,最后给出了一些实验结果 。 展开更多
关键词 蛋白质结构预测 NP难度问题 折叠 拟物算法 引力势能
下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部