期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测 被引量:1
1
作者 刘冰静 郭红 《福州大学学报(自然科学版)》 CAS 北大核心 2017年第1期16-24,共9页
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因... 提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率. 展开更多
关键词 定位预测 蛋白质亚细胞 位置异性得分矩阵 基因本体 多标签分类
下载PDF
利用位点特异性打分矩阵对大肠杆菌启动子的预测 被引量:2
2
作者 闫妍 万平 《生物信息学》 2015年第2期125-130,共6页
启动子是基因转录起始的一个关键性元件。本研究利用数据库中提供的大肠杆菌启动子数据,基于位点特异性打分矩阵(Position-specific scoring matrix,PSSM)算法建立了大肠杆菌启动子预测方法,并采用ROC曲线对预测结果进行评估。结果显示... 启动子是基因转录起始的一个关键性元件。本研究利用数据库中提供的大肠杆菌启动子数据,基于位点特异性打分矩阵(Position-specific scoring matrix,PSSM)算法建立了大肠杆菌启动子预测方法,并采用ROC曲线对预测结果进行评估。结果显示,本方法对大肠杆菌sigma24、sigma28、sigma32、sigma38、sigma54和sigma70启动子预测的准确度分别达到86%,96%,93%,96%,97%和74%。由于原核生物启动子序列的保守性,可将该方法推广至其他原核生物的启动子预测。 展开更多
关键词 大肠杆菌 启动子 位点异性打分矩阵(pssm) 预测
下载PDF
基于DNA结合特异性权重矩阵的TAL效应物靶标预测
3
作者 李可力 玉延华 陈庆锋 《平顶山学院学报》 2014年第5期60-67,共8页
计算预测出TAL效应物的候选靶标有助于高效地确定TAL效应物的靶基因,进而阐明TAL效应物的生物学功能,但是目前在TAL效应物靶标计算预测方面的研究仍然很少.为了设计出预测TAL效应物靶标的有效算法,基于TAL效应物的已知靶标数据,构建了TA... 计算预测出TAL效应物的候选靶标有助于高效地确定TAL效应物的靶基因,进而阐明TAL效应物的生物学功能,但是目前在TAL效应物靶标计算预测方面的研究仍然很少.为了设计出预测TAL效应物靶标的有效算法,基于TAL效应物的已知靶标数据,构建了TAL效应物靶点的RVD-核苷酸关联矩阵,并将RVD-核苷酸关联矩阵归一化成RVD特异性概率矩阵,为靶标预测构造新的打分函数.实验结果表明,改进的TAL效应物靶标预测算法对大部分已知靶标预测的打分排名比已有算法更靠前,并且结合基因表达数据可以预测出TAL效应物的新的候选靶标. 展开更多
关键词 TAL效应物 结合异性 位置权重矩阵(PWM) 打分函数 靶标预测
下载PDF
基于加权PSSM直方图和随机森林集成的蛋白质交互作用位点预测 被引量:7
4
作者 魏志森 杨静宇 於东军 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第4期379-385,共7页
为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森... 为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森林集成分类器。相对于传统的特征,该文所提新特征具有更低的维数,同时拥有更好的鉴别性。分类器集成则缓解了下采样带来的信息丢失,并提高了分类精度。实验结果验证了所述方法是有效的,在标准数据集上的结果优于其他最新的蛋白质相互作用位点预测方法。 展开更多
关键词 蛋白质作用 位置异性得分矩阵 加权得分矩阵直方图 随机森林 分类器集成
下载PDF
基于分类器集成的跨膜蛋白两亲螺旋区域位置预测 被引量:4
5
作者 郜法启 於东军 沈红斌 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第4期431-437,共7页
为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用... 为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用下采样的方法,降低了AHs的搜索空间;在此基础上训练基于支持向量机(Support vector machine,SVM)的集成分类器用于AHs预测。为了客观评价AHs的预测性能,首次构建了领域内较为完备可用的标准数据集。在此数据集上的实验结果表明所提方法优于其他AHs预测方法。 展开更多
关键词 跨膜蛋白 两亲螺旋区域 位置异性得分矩阵 疏水矩 分类器集成
下载PDF
基于多视角特征融合与随机森林的蛋白质结晶预测 被引量:2
6
作者 李强 郑宇杰 《现代电子技术》 北大核心 2015年第8期50-53,共4页
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费... X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(Pse AAC)和伪位置特异性得分矩阵特征(Pse PSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。 展开更多
关键词 蛋白质结晶 伪氨基酸组成 位置异性得分矩阵 随机森林
下载PDF
基于序列与结构特征结合的蛋白质与DNA绑定位点预测 被引量:1
7
作者 杨骥 《计算机与现代化》 2016年第1期20-25,共6页
目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及... 目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及表面积、相对表面积、深度和突出指数这几个结合效果良好的结构特征的DNA与蛋白质绑定位点预测方法,并使用随机下采样方法解决训练集样本不平衡问题,最后使用支持向量机算法进行预测。实验结果表明,本文方法具有较好的预测能力。 展开更多
关键词 位置异性得分矩阵 可及表面积 相对表面积 深度与突出指数 随机下采样 支持向量机
下载PDF
基于间隔二肽组分和递归特征消除法的DNA结合蛋白的鉴定
8
作者 汤亚东 刘潇 +2 位作者 刘太岗 谢鹭 陈兰明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2018年第4期453-459,共7页
DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature eliminati... DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature elimination,RFE)鉴定DBPs.首先获得待测蛋白质氨基酸序列的位置特异性得分矩阵(position specific scoring matrix,PSSM),在此基础上提取蛋白质的Gap DPC特征,通过RFE法选择最优特征,然后利用支持向量机(support vector machine,SVM)作为分类器,在蛋白质序列数据集PDB396和LB1068中进行夹克刀交叉验证(jackknife cross validation test).研究结果显示,基于PDB396和LB1068数据集,DBPs预测的准确率、Matthews相关系数、敏感性和特异性分别达到93.43%、0.86、89.04%和96.00%,以及86.33%、0.73、86.49%和86.18%,明显优于文献报道中的相关方法,为DBPs的鉴定提供了新的模型. 展开更多
关键词 DNA结合蛋白 间隔二肽组分 位置异性得分矩阵 递归征消除法 支持向量机分类器
下载PDF
基于小波特征提取和支持向量机的蛋白质二级结构预测
9
作者 王剑 成金勇 《生物医学》 2019年第1期17-22,共6页
蛋白质的结构对理解蛋白质的生物学功能意义重大,蛋白质结构的预测就能预测和理解未知蛋白质生物学功能的作用,并且蛋白质二级结构的预测是对蛋白质结构的预测起决定性作用的,在蛋白质二级结构预测的研究中,将蛋白质单个残基用位置特异... 蛋白质的结构对理解蛋白质的生物学功能意义重大,蛋白质结构的预测就能预测和理解未知蛋白质生物学功能的作用,并且蛋白质二级结构的预测是对蛋白质结构的预测起决定性作用的,在蛋白质二级结构预测的研究中,将蛋白质单个残基用位置特异性打分矩阵(PSSM)进行编码,取窗口后可以将一个蛋白质残基表示成一个2维的伪图像平面,在原位置特异性打分矩阵数据平面的基础上,用小波变换提取到伪图像平面不同分辨率水平上的低频特征和高频特征与原PSSM平面数据当作一个蛋白质残基携带的样本信息,并用支持向量机对预测进行训练模型。 展开更多
关键词 蛋白质二级结构预测 位置异性打分矩阵 伪图像 小波变换 支持向量机
下载PDF
蛋白质中RNA-结合残基预测的随机森林模型 被引量:10
10
作者 马昕 郭静 孙啸 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第1期50-54,共5页
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的... 构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台. 展开更多
关键词 随机森林 位置异性矩阵 嵌套式交叉验证 RNA-结合残基
下载PDF
基于SVM的革兰氏阴性菌分泌系统蛋白识别方法 被引量:2
11
作者 余乐正 赵柳青 +2 位作者 陈曼 罗杰斯 柳凤娟 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期443-447,共5页
本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性... 本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性能,可作为细菌分泌系统研究的有益补充. 展开更多
关键词 革兰氏阴性细菌 分泌系统蛋白 SVM 位置异性得分矩阵
下载PDF
基于SVM-RFE算法的凋亡蛋白亚细胞定位预测 被引量:4
12
作者 刘太岗 王春华 《计算机工程与应用》 CSCD 北大核心 2017年第10期155-159,共5页
获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之... 获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。 展开更多
关键词 位置异性得分矩阵 自协方差变换 支持向量机 递归征消除 夹克刀检验
下载PDF
蛋白亚细胞定位的预测方法研究 被引量:6
13
作者 王明会 李骜 +1 位作者 谢丹 冯焕清 《北京生物医学工程》 2006年第6期649-653,657,共6页
预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高... 预测蛋白质的亚细胞定位信息对于了解其功能有重要的意义。选择氨基酸组成、氨基酸对组成、位置特异性打分矩阵三种分类特征以及模糊k近邻、支持向量机两种预测方法,分别进行了测试。对预测结果的分析显示,位置特异性打分矩阵可以提高对不同亚细胞器的可区分性;而支持向量机可以更好地利用位置特异性打分矩阵特征进行预测。使用氨基酸组成和位置特异性打分矩阵两种特征,并结合支持向量机,是一种有效的亚细胞定位预测方法。 展开更多
关键词 亚细胞定位 位置异性打分矩阵 模糊k近邻 支持向量机 生物信息学
下载PDF
不同类型的革兰氏阴性菌分泌系统蛋白分类研究 被引量:1
14
作者 余乐正 陈曼 +2 位作者 赵柳青 罗杰斯 柳凤娟 《化学研究与应用》 CAS CSCD 北大核心 2015年第7期969-973,共5页
革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重... 革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重要意义。以氨基酸组成和位置特异性得分矩阵为替代模型,本文构建了一个基于支持向量机构的多元分类器以快速区分不同类型的革兰氏阴性菌分泌系统蛋白。实验结果表明,本方法对I、II及V型分泌系统蛋白具有较好的预测性能。 展开更多
关键词 革兰氏阴性菌 分泌系统蛋白 支持向量机 位置异性得分矩阵
下载PDF
基于进化信息和支持向量机的酶蛋白亚家族预测 被引量:1
15
作者 冯焕清 张相华 许文龙 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期765-769,共5页
提出一种使用PSI-BLAST得到的位置特异性打分矩阵中蕴含的进化信息作为酶蛋白的特征表示,结合支持向量机方法对酶蛋白的亚家族类别进行预测的方法.对包含16类亚家族的2 640条氧化还原酶数据集进行jacknife测试,总的预测精度达到92.12%,... 提出一种使用PSI-BLAST得到的位置特异性打分矩阵中蕴含的进化信息作为酶蛋白的特征表示,结合支持向量机方法对酶蛋白的亚家族类别进行预测的方法.对包含16类亚家族的2 640条氧化还原酶数据集进行jacknife测试,总的预测精度达到92.12%,高于目前的任何其他预测方法.实验结果表明,进化信息是酶蛋白序列的有效表示,将其与支持向量机结合能够实现对酶蛋白亚家族的高精度预测. 展开更多
关键词 酶蛋白亚家族预测 进化信息 支持向量机 位置异性打分矩阵
下载PDF
固有无序蛋白与结合配体作用位点的分析与预测 被引量:1
16
作者 冯永娥 孙鹏哲 张强 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2023年第4期442-448,共7页
固有无序蛋白(简称IDPs)在生理条件下不具有稳定的二级或三级结构,但是在生物体内通过与结合配体相互作用来发挥重要的生物学功能,故研究固有无序蛋白与配体的相互作用,对理解这些蛋白的功能具有重要的生物学意义。本文基于IDPsBind数据... 固有无序蛋白(简称IDPs)在生理条件下不具有稳定的二级或三级结构,但是在生物体内通过与结合配体相互作用来发挥重要的生物学功能,故研究固有无序蛋白与配体的相互作用,对理解这些蛋白的功能具有重要的生物学意义。本文基于IDPsBind数据库,获得固有无序蛋白与5类配体分子(DNA,RNA,金属离子,肽,小分子)结合的结合位点,然后对这些结合位点处残基出现在5类结合位点的倾向性进行分析,结果发现:5类配体分子的结合位点处氨基酸的分布是不一样的。然后,利用滑动窗口中心残基的结合配体类型,建立5类结合配体的结合位点数据集,并提取四种特征参数:位置特异性矩阵(PSSM),20种氨基酸组分(AAC),以及残基的疏水性(HP)和溶剂可及表面积(SASA)特征,结合机器学习算法对5类结合位点进行分类识别,在5折交叉检验结果中预测准确率(Acc)最高达到87%,当特征融合后,预测准确率(Acc)达到88.3%。该研究结果对固有无序蛋白与结合配体相互作用的分析提供了很好的参考。 展开更多
关键词 固有无序蛋白 结合位点 位置异性打分矩阵 支持向量机
下载PDF
基于差分进化算法的MHC-I结合亲和力预测方法
17
作者 丛春雨 王忠英 《电子技术与软件工程》 2015年第22期187-187,共1页
在细胞免疫反应中,抗原表位与MHCs的结合扮演着重要角色。预测多肽与MHC分子结合的准确率已有很大的进步,最近,MHC-多肽的结合预测模型趋向预测结合力亲和力的大小,代替了以前判断多肽是"结合"和"不结合"的预测结果... 在细胞免疫反应中,抗原表位与MHCs的结合扮演着重要角色。预测多肽与MHC分子结合的准确率已有很大的进步,最近,MHC-多肽的结合预测模型趋向预测结合力亲和力的大小,代替了以前判断多肽是"结合"和"不结合"的预测结果,在本文中,使用了差分进化算法与位置特异性得分矩阵相结合的方法来预测多肽与MHC-I的结合亲和力。 展开更多
关键词 主要组织相容性复合体(MHC) 预测结合力 差分进化算法(DE) 位置异性得分矩阵(pssm) 多肽
下载PDF
基于支持向量机的癌细胞经典分泌蛋白与非经典分泌蛋白识别研究 被引量:4
18
作者 余乐正 柳凤娟 +2 位作者 李东海 郭延芝 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期152-156,共5页
基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典... 基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典分泌蛋白具有较强的区分能力,可为寻找到不同种类癌症间通用的生物标志物提供理论参考. 展开更多
关键词 支持向量机 癌症 非经典分泌蛋白 位置异性得分矩阵 信号肽
下载PDF
一种快速准确区分Ⅲ型、Ⅳ型分泌效应蛋白的计算方法 被引量:1
19
作者 柳凤娟 杨庆 +2 位作者 陈倩 余乐正 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期781-785,共5页
通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪... 通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪位置特异性得分矩阵,本文提出了一种可快速准确识别革兰氏阴性菌Ⅲ型、Ⅳ型效应蛋白的计算方法.测试集实验结果表明,本方法对Ⅲ型、Ⅳ型效应蛋白具有较好的分类效果,可作为辅助工具用于分泌效应蛋白的进一步研究. 展开更多
关键词 革兰氏阴性菌 分泌效应蛋白 支持向量机 位置异性得分矩阵 留一法
下载PDF
序列蛋白质-GDP绑定位点预测 被引量:2
20
作者 石大宏 何雪 《计算机工程与应用》 CSCD 北大核心 2016年第13期55-59,75,共6页
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向... 正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。 展开更多
关键词 蛋白质-GDP绑定预测 位置异性得分矩阵 稀疏表示 加权下采样 支持向量机
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部