期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于位置特异性谱和输入加权神经网络的蛋白质亚细胞定位预测(英文) 被引量:3
1
作者 邹凌云 王正志 黄教民 《Journal of Genetics and Genomics》 SCIE CAS CSCD 北大核心 2007年第12期1080-1087,共8页
蛋白质必须处于正确的亚细胞位置才能行使其功能。文章利用PSI-BLAST工具搜索蛋白质序列,提取位点特异性谱中的位点特异性得分矩阵作为蛋白质的一类特征,并计算4等分序列的氨基酸含量以及1~7阶二肽含量作为另外两类特征,由这三类特征... 蛋白质必须处于正确的亚细胞位置才能行使其功能。文章利用PSI-BLAST工具搜索蛋白质序列,提取位点特异性谱中的位点特异性得分矩阵作为蛋白质的一类特征,并计算4等分序列的氨基酸含量以及1~7阶二肽含量作为另外两类特征,由这三类特征一共得到蛋白质序列的12个特征向量。通过设计一个简单加权函数对各类特征向量加权处理,作为神经网络预测器的输入,并使用Levenberg-Marquardt算法代替传统的EBP算法来调整网络权值和阈值,大大提高了训练速度。对具有4类亚细胞位置和12类亚细胞位置的两种蛋白质数据集分别进行"留一法"测试和5倍交叉验证测试,总体预测精度分别达到88.4%和83.3%。其中,对4类亚细胞位置数据集的预测效果优于普通BP神经网络、隐马尔可夫模型、模糊K邻近等预测方法,对12类亚细胞位置数据集的预测效果优于支持向量机分类方法。最后还对三类特征采取不同加权比例对预测精度的影响进行了讨论,对选择的八种加权比例的预测结果表明,分别给予三类特征合适的权值系数可以进一步提高预测精度。 展开更多
关键词 亚细胞定位 位置特异性迭代BLAST 位置特异性得分矩阵 加权函数 BP神经网络
下载PDF
位置特异性和项目呈现方式对即时情景记忆顺序重构的影响 被引量:2
2
作者 钟毅平 陈智勇 《心理学探新》 CSSCI 2010年第5期34-39,共6页
在Healy等人(2008)的实验范式基础上,以中文姓名作为实验材料,探究位置特异性和项目呈现方式对即时情景记忆的影响。两个实验都要求被试对所呈现的20个姓名中的12个进行顺序重构。重构的12个位置分别为1-12、5-16、9-20三个水平,这三组... 在Healy等人(2008)的实验范式基础上,以中文姓名作为实验材料,探究位置特异性和项目呈现方式对即时情景记忆的影响。两个实验都要求被试对所呈现的20个姓名中的12个进行顺序重构。重构的12个位置分别为1-12、5-16、9-20三个水平,这三组位置同时包括绝对位置9-12。实验1采取视觉呈现,比较三个任务类型上重构正确率的差异。实验1的结果支持Healy的编码特异性理论,但是末尾呈现的项目仅有较小的重构优势。实验2采取听觉呈现,结果发现,在系列位置5-16上出现了较明显的近因效应,而在位置9-20上并无明显的近因效应。这表明位置特异性理论对顺序重构的影响主要表现为绝对位置的特异性而并非相对位置的特异性,系列位置效应出现在记忆的编码过程而不是提取过程。 展开更多
关键词 位置特异性 即时情景记忆 系列位置效应 绝对位置 相对位置
下载PDF
以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测 被引量:1
3
作者 刘冰静 郭红 《福州大学学报(自然科学版)》 CAS 北大核心 2017年第1期16-24,共9页
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因... 提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率. 展开更多
关键词 定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类
下载PDF
基于氨基酸位置特异性的蛋白质Loop区结构预测改进方法
4
作者 袁飞 张传彪 +1 位作者 周昕 黎明 《物理学报》 SCIE EI CAS CSCD 北大核心 2016年第15期267-276,共10页
蛋白质loop区的结构预测是理解蛋白质功能的重要一环,而长loop区的结构预测至今还是生物信息学中的难题.目前己经出现了多种loop结构的算法,其中LEAP是预测精度最高的算法之一,但它在长loop区初始主链构象采样上仍有较大的改进余地.本... 蛋白质loop区的结构预测是理解蛋白质功能的重要一环,而长loop区的结构预测至今还是生物信息学中的难题.目前己经出现了多种loop结构的算法,其中LEAP是预测精度最高的算法之一,但它在长loop区初始主链构象采样上仍有较大的改进余地.本文中我们将蛋白质二级结构预测算法SPINE X与LEAP算法结合起来,构建了新的主链扭转角分布图(拉氏图),在主链初始构象采样中引入氨基酸在蛋白序列中的位置特异性信息,使得初始构象的采样更具针对性,对取自CASP10单链蛋白的loop测试集的分析表明,对长度为10,11,12个氨基酸的长loop区,改进后算法都比原始LEAP算法的预测精度有显著提升.这种引入氨基酸位置特异性从而提高预测精度的思路有望进一步推广至loop结构预测的其他算法. 展开更多
关键词 loop区结构预测 初始主链构象 氨基酸位置特异性 拉氏图
下载PDF
基于残基位置特异性改进二级结构预测精度
5
作者 段谟杰 朱伟 黄慧艳 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第2期129-132,共4页
利用二级结构端点附近残基的特异性分布特征,应用支持向量机(SVM)预测二级结构端点并得出蛋白质上各位置为端点的可能性分值.根据预测出的端点可能性分值对目前的二级结构预测工具进行端点校正.对psiSVM和PSIPRED这两种工具进行了校正... 利用二级结构端点附近残基的特异性分布特征,应用支持向量机(SVM)预测二级结构端点并得出蛋白质上各位置为端点的可能性分值.根据预测出的端点可能性分值对目前的二级结构预测工具进行端点校正.对psiSVM和PSIPRED这两种工具进行了校正和测试,结果表明校正后端点预测精度相对于psiSVM提高约10%,相对于PSIPRED提高近5%,同时整体预测精度也有一定程度的提高. 展开更多
关键词 蛋白质 二级结构预测 预测精度 残基位置特异性 端点结果校正
原文传递
基于分类器集成的跨膜蛋白两亲螺旋区域位置预测 被引量:4
6
作者 郜法启 於东军 沈红斌 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第4期431-437,共7页
为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用... 为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用下采样的方法,降低了AHs的搜索空间;在此基础上训练基于支持向量机(Support vector machine,SVM)的集成分类器用于AHs预测。为了客观评价AHs的预测性能,首次构建了领域内较为完备可用的标准数据集。在此数据集上的实验结果表明所提方法优于其他AHs预测方法。 展开更多
关键词 跨膜蛋白 两亲螺旋区域 位置特异性得分矩阵 疏水矩 分类器集成
下载PDF
基于多视角特征融合与随机森林的蛋白质结晶预测 被引量:2
7
作者 李强 郑宇杰 《现代电子技术》 北大核心 2015年第8期50-53,共4页
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费... X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(Pse AAC)和伪位置特异性得分矩阵特征(Pse PSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。 展开更多
关键词 蛋白质结晶 伪氨基酸组成 位置特异性得分矩阵 随机森林
下载PDF
基于序列与结构特征结合的蛋白质与DNA绑定位点预测 被引量:1
8
作者 杨骥 《计算机与现代化》 2016年第1期20-25,共6页
目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及... 目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及表面积、相对表面积、深度和突出指数这几个结合效果良好的结构特征的DNA与蛋白质绑定位点预测方法,并使用随机下采样方法解决训练集样本不平衡问题,最后使用支持向量机算法进行预测。实验结果表明,本文方法具有较好的预测能力。 展开更多
关键词 位置特异性得分矩阵 可及表面积 相对表面积 深度与突出指数 随机下采样 支持向量机
下载PDF
基于间隔二肽组分和递归特征消除法的DNA结合蛋白的鉴定
9
作者 汤亚东 刘潇 +2 位作者 刘太岗 谢鹭 陈兰明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2018年第4期453-459,共7页
DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature eliminati... DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature elimination,RFE)鉴定DBPs.首先获得待测蛋白质氨基酸序列的位置特异性得分矩阵(position specific scoring matrix,PSSM),在此基础上提取蛋白质的Gap DPC特征,通过RFE法选择最优特征,然后利用支持向量机(support vector machine,SVM)作为分类器,在蛋白质序列数据集PDB396和LB1068中进行夹克刀交叉验证(jackknife cross validation test).研究结果显示,基于PDB396和LB1068数据集,DBPs预测的准确率、Matthews相关系数、敏感性和特异性分别达到93.43%、0.86、89.04%和96.00%,以及86.33%、0.73、86.49%和86.18%,明显优于文献报道中的相关方法,为DBPs的鉴定提供了新的模型. 展开更多
关键词 DNA结合蛋白 间隔二肽组分 位置特异性得分矩阵 递归征消除法 支持向量机分类器
下载PDF
基于小波特征提取和支持向量机的蛋白质二级结构预测
10
作者 王剑 成金勇 《生物医学》 2019年第1期17-22,共6页
蛋白质的结构对理解蛋白质的生物学功能意义重大,蛋白质结构的预测就能预测和理解未知蛋白质生物学功能的作用,并且蛋白质二级结构的预测是对蛋白质结构的预测起决定性作用的,在蛋白质二级结构预测的研究中,将蛋白质单个残基用位置特异... 蛋白质的结构对理解蛋白质的生物学功能意义重大,蛋白质结构的预测就能预测和理解未知蛋白质生物学功能的作用,并且蛋白质二级结构的预测是对蛋白质结构的预测起决定性作用的,在蛋白质二级结构预测的研究中,将蛋白质单个残基用位置特异性打分矩阵(PSSM)进行编码,取窗口后可以将一个蛋白质残基表示成一个2维的伪图像平面,在原位置特异性打分矩阵数据平面的基础上,用小波变换提取到伪图像平面不同分辨率水平上的低频特征和高频特征与原PSSM平面数据当作一个蛋白质残基携带的样本信息,并用支持向量机对预测进行训练模型。 展开更多
关键词 蛋白质二级结构预测 位置特异性打分矩阵 伪图像 小波变换 支持向量机
下载PDF
固有无序蛋白与结合配体作用位点的分析与预测 被引量:1
11
作者 冯永娥 孙鹏哲 张强 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2023年第4期442-448,共7页
固有无序蛋白(简称IDPs)在生理条件下不具有稳定的二级或三级结构,但是在生物体内通过与结合配体相互作用来发挥重要的生物学功能,故研究固有无序蛋白与配体的相互作用,对理解这些蛋白的功能具有重要的生物学意义。本文基于IDPsBind数据... 固有无序蛋白(简称IDPs)在生理条件下不具有稳定的二级或三级结构,但是在生物体内通过与结合配体相互作用来发挥重要的生物学功能,故研究固有无序蛋白与配体的相互作用,对理解这些蛋白的功能具有重要的生物学意义。本文基于IDPsBind数据库,获得固有无序蛋白与5类配体分子(DNA,RNA,金属离子,肽,小分子)结合的结合位点,然后对这些结合位点处残基出现在5类结合位点的倾向性进行分析,结果发现:5类配体分子的结合位点处氨基酸的分布是不一样的。然后,利用滑动窗口中心残基的结合配体类型,建立5类结合配体的结合位点数据集,并提取四种特征参数:位置特异性矩阵(PSSM),20种氨基酸组分(AAC),以及残基的疏水性(HP)和溶剂可及表面积(SASA)特征,结合机器学习算法对5类结合位点进行分类识别,在5折交叉检验结果中预测准确率(Acc)最高达到87%,当特征融合后,预测准确率(Acc)达到88.3%。该研究结果对固有无序蛋白与结合配体相互作用的分析提供了很好的参考。 展开更多
关键词 固有无序蛋白 结合位点 位置特异性打分矩阵 支持向量机
下载PDF
基于氨基酸理化特征识别疾病相关的蛋白质与金属离子配体的结合位点
12
作者 邹向辉 冯永娥 《内蒙古农业大学学报(自然科学版)》 CAS 北大核心 2024年第2期78-85,共8页
蛋白质与金属离子配体的结合在维持蛋白质结构稳定和代谢控制等方面起重要作用。为了帮助研究者理解蛋白质与金属离子相互作用的分子机制,确定蛋白质与哪种金属离子配体的结合是非常必要的。目前大部分的研究只针对金属离子结合位点与... 蛋白质与金属离子配体的结合在维持蛋白质结构稳定和代谢控制等方面起重要作用。为了帮助研究者理解蛋白质与金属离子相互作用的分子机制,确定蛋白质与哪种金属离子配体的结合是非常必要的。目前大部分的研究只针对金属离子结合位点与非结合位点的预测研究,本文基于氨基酸理化特征结合机器学习算法构建模型,针对疾病相关的蛋白质与3种金属离子配体(Ca^(2+)、Mg^(2+)、Zn^(2+))的结合位点进行三分类的识别。首先,基于国际公共数据库资源,构建了疾病相关的蛋白质与3种金属离子配体的结合位点数据库。然后,在滑动窗口下,提取5种特征(PSSM,PAAC,PDC,HAAC,HDC),再结合2种机器学习算法对3种金属离子配体的结合位点进行识别。结果发现:在单特征预测中,使用位置特异性矩阵(PSSM)的预测结果最好,预测总精度(OA)达到72.6%。最后,做了特征融合,结果发现:其他特征在联合了位置特异性矩阵(PSSM)后,结果相较于其单特征,预测总精度均有较大提高。可见该模型对于疾病相关蛋白与金属离子配体的结合位点有较好的识别能力。 展开更多
关键词 金属离子配体 位置特异性打分矩阵 亲疏水氨基酸组分 机器学习算法
原文传递
蛋白质中RNA-结合残基预测的随机森林模型 被引量:10
13
作者 马昕 郭静 孙啸 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第1期50-54,共5页
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的... 构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台. 展开更多
关键词 随机森林 位置特异性矩阵 嵌套式交叉验证 RNA-结合残基
下载PDF
基于SVM的革兰氏阴性菌分泌系统蛋白识别方法 被引量:2
14
作者 余乐正 赵柳青 +2 位作者 陈曼 罗杰斯 柳凤娟 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期443-447,共5页
本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性... 本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性能,可作为细菌分泌系统研究的有益补充. 展开更多
关键词 革兰氏阴性细菌 分泌系统蛋白 SVM 位置特异性得分矩阵
下载PDF
蛋白亚细胞定位的预测方法研究 被引量:6
15
作者 王明会 李骜 +1 位作者 谢丹 冯焕清 《北京生物医学工程》 2006年第6期649-653,657,共6页
预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高... 预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高对不同亚细胞器的可区分性;而支持向量机可以更好地利用位置特异性打分矩阵特征进行预测。使用氨基酸组成和位置特异性打分矩阵两种特征,并结合支持向量机,是一种有效的亚细胞定位预测方法。 展开更多
关键词 亚细胞定位 位置特异性打分矩阵 模糊k近邻 支持向量机 生物信息学
下载PDF
基于SVM-RFE算法的凋亡蛋白亚细胞定位预测 被引量:4
16
作者 刘太岗 王春华 《计算机工程与应用》 CSCD 北大核心 2017年第10期155-159,共5页
获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之... 获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。 展开更多
关键词 位置特异性得分矩阵 自协方差变换 支持向量机 递归征消除 夹克刀检验
下载PDF
不同类型的革兰氏阴性菌分泌系统蛋白分类研究 被引量:1
17
作者 余乐正 陈曼 +2 位作者 赵柳青 罗杰斯 柳凤娟 《化学研究与应用》 CAS CSCD 北大核心 2015年第7期969-973,共5页
革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重... 革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重要意义。以氨基酸组成和位置特异性得分矩阵为替代模型,本文构建了一个基于支持向量机构的多元分类器以快速区分不同类型的革兰氏阴性菌分泌系统蛋白。实验结果表明,本方法对I、II及V型分泌系统蛋白具有较好的预测性能。 展开更多
关键词 革兰氏阴性菌 分泌系统蛋白 支持向量机 位置特异性得分矩阵
下载PDF
基于进化信息和支持向量机的酶蛋白亚家族预测 被引量:1
18
作者 冯焕清 张相华 许文龙 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期765-769,共5页
提出一种使用PSI-BLAST得到的位置特异性打分矩阵中蕴含的进化信息作为酶蛋白的特征表示,结合支持向量机方法对酶蛋白的亚家族类别进行预测的方法.对包含16类亚家族的2 640条氧化还原酶数据集进行jacknife测试,总的预测精度达到92.12%,... 提出一种使用PSI-BLAST得到的位置特异性打分矩阵中蕴含的进化信息作为酶蛋白的特征表示,结合支持向量机方法对酶蛋白的亚家族类别进行预测的方法.对包含16类亚家族的2 640条氧化还原酶数据集进行jacknife测试,总的预测精度达到92.12%,高于目前的任何其他预测方法.实验结果表明,进化信息是酶蛋白序列的有效表示,将其与支持向量机结合能够实现对酶蛋白亚家族的高精度预测. 展开更多
关键词 酶蛋白亚家族预测 进化信息 支持向量机 位置特异性打分矩阵
下载PDF
基于XGBoost算法的水稻基因组6mA位点识别研究
19
作者 孙福权 梁莹 《计算机科学》 CSCD 北大核心 2022年第S01期309-313,共5页
N6-甲基腺嘌呤(6mA)位点在调控真核生物的基因表达中起着至关重要的作用,准确识别6mA位点有助于理解基因组6mA位点的分布和生物功能。目前,各种实验测定方法应用于识别不同物种体内的6mA位点,但其太昂贵和耗时。基于此,文中提出了一种基... N6-甲基腺嘌呤(6mA)位点在调控真核生物的基因表达中起着至关重要的作用,准确识别6mA位点有助于理解基因组6mA位点的分布和生物功能。目前,各种实验测定方法应用于识别不同物种体内的6mA位点,但其太昂贵和耗时。基于此,文中提出了一种基于XGBoost的识别水稻基因组6mA位点模型P6mA-Rice。首先,通过引入序列核苷酸位置特异性及其他相关DNA性质,从7个方面提出了有效的特征提取准则,使其更全面地提取DNA信息;然后,基于XGBoost算法的特征重要性进行了进一步特征筛选,最终获得了特征集合P6mA;最后,在此基础之上,基于所选XGBoost分类算法,成功构建了P6mA-Rice甲基化位点识别模型。其相应的小刀实验结果表明,P6mA-Rice的敏感性为90.55%,特异性为88.48%,相关系数为79.00%,准确率为89.49%。大量实验验证了P6mA-Rice模型的有效性。 展开更多
关键词 N6-甲基腺嘌呤 序列位置特异性 XGBoost DNA 序列
下载PDF
基于支持向量机的癌细胞经典分泌蛋白与非经典分泌蛋白识别研究 被引量:4
20
作者 余乐正 柳凤娟 +2 位作者 李东海 郭延芝 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期152-156,共5页
基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典... 基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典分泌蛋白具有较强的区分能力,可为寻找到不同种类癌症间通用的生物标志物提供理论参考. 展开更多
关键词 支持向量机 癌症 非经典分泌蛋白 位置特异性得分矩阵 信号肽
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部