期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测 被引量:1
1
作者 刘冰静 郭红 《福州大学学报(自然科学版)》 CAS 北大核心 2017年第1期16-24,共9页
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因... 提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率. 展开更多
关键词 定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类
下载PDF
基于矩阵得分的蛋白质β-hairpins模体识别
2
作者 姜雪 马芳 《牡丹江师范学院学报(自然科学版)》 2011年第1期9-11,共3页
用矩阵得分的方法,从蛋白质的氨基酸序列出发,以氨基酸紧邻关联为参量,分别对6 035个和4 884个β-hairpins模体进行识别.利用10-fold cross-validation检验,识别总精度分别达到85.4%和81.2%.
关键词 β-hairpin模体 位置得分矩阵 序列模式
下载PDF
基于分类器集成的跨膜蛋白两亲螺旋区域位置预测 被引量:4
3
作者 郜法启 於东军 沈红斌 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第4期431-437,共7页
为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用... 为提高跨膜蛋白两亲螺旋区域(Amphipathic helices,AHs)预测的精度,基于蛋白质位置特异性得分矩阵、二级结构以及疏水矩,提出了一种新的衡量两亲性的螺旋周期性(Helix periodicity,HP)特征;利用Mem Brain预测器滤除跨膜区域片段并使用下采样的方法,降低了AHs的搜索空间;在此基础上训练基于支持向量机(Support vector machine,SVM)的集成分类器用于AHs预测。为了客观评价AHs的预测性能,首次构建了领域内较为完备可用的标准数据集。在此数据集上的实验结果表明所提方法优于其他AHs预测方法。 展开更多
关键词 跨膜蛋白 两亲螺旋区域 位置特异性得分矩阵 疏水矩 分类器集成
下载PDF
基于SVM的革兰氏阴性菌分泌系统蛋白识别方法 被引量:2
4
作者 余乐正 赵柳青 +2 位作者 陈曼 罗杰斯 柳凤娟 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期443-447,共5页
本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性... 本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性能,可作为细菌分泌系统研究的有益补充. 展开更多
关键词 革兰氏阴性细菌 分泌系统蛋白 SVM 位置特异性得分矩阵
下载PDF
Prediction of Subcellular Localization of Eukaryotic Proteins Using Position-Specific Profiles and Neural Network with Weighted Inputs 被引量:3
5
作者 邹凌云 王正志 黄教民 《Journal of Genetics and Genomics》 SCIE CAS CSCD 北大核心 2007年第12期1080-1087,共8页
Subcellular location is one of the key biological characteristics of proteins. Position-specific profiles (PSP) have been introduced as important characteristics of proteins in this article. In this study, to obtain... Subcellular location is one of the key biological characteristics of proteins. Position-specific profiles (PSP) have been introduced as important characteristics of proteins in this article. In this study, to obtain position-specific profiles, the Position Specific lterative-Basic Local Alignment Search Tool (PSI-BLAST) has been used to search for protein sequences in a database. Position-specific scoring matrices are extracted from the profiles as one class of characteristics. Four-part amino acid compositions and lst-7th order dipeptide compositions have also been calculated as the other two classes of characteristics. Therefore, twelve characteristic vectors are extracted from each of the protein sequences. Next, the characteristic vectors are weighed by a simple weighing function and inputted into a BP neural network predictor named PSP-Weighted Neural Network (PSP-WNN). The Levenberg-Marquardt algorithm is employed to adjust the weight matrices and thresholds during the network training instead of the error back propagation algorithm. With a jackknife test on the RH2427 dataset, PSP-WNN has achieved a higher overall prediction accuracy of 88.4% rather than the prediction results by the general BP neural network, Markov model, and fuzzy k-nearest neighbors algorithm on this dataset. In addition, the prediction performance of PSP-WNN has been evaluated with a five-fold cross validation test on the PK7579 dataset and the prediction results have been consistently better than those of the previous method on the basis of several support vector machines, using compositions of both amino acids and amino acid pairs. These results indicate that PSP-WNN is a powerful tool for subcellular localization prediction. At the end of the article, influences on prediction accuracy using different weighting proportions among three characteristic vector categories have been discussed. An appropriate proportion is considered by increasing the prediction accuracy. 展开更多
关键词 subcellular localization PSI-BLAST position-specific scoring matrices weighting function BP neural network
下载PDF
基于SVM-RFE算法的凋亡蛋白亚细胞定位预测 被引量:4
6
作者 刘太岗 王春华 《计算机工程与应用》 CSCD 北大核心 2017年第10期155-159,共5页
获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之... 获取凋亡蛋白亚细胞定位的信息对揭示细胞程序性死亡的机制和注解蛋白质功能都具有非常重要的意义。鉴于实验方法确定亚细胞定位不仅费时费力而且代价过高,开发快速有效的计算方法预测亚细胞定位已成为生物信息学领域的重要研究内容之一。首先基于位置特异性得分矩阵提取氨基酸组分、二肽组分和自协方差变量等特征构建蛋白质序列的特征表示模型,然后采用递归特征消除法进行特征选择,最后选用支持向量机分类器在两个常用数据集上进行夹克刀检验。实验结果表明,该方法优于大多数已报道的预测方法,从而证明了其有效性。 展开更多
关键词 位置特异性得分矩阵 自协方差变换 支持向量机 递归特征消除 夹克刀检验
下载PDF
不同类型的革兰氏阴性菌分泌系统蛋白分类研究 被引量:1
7
作者 余乐正 陈曼 +2 位作者 赵柳青 罗杰斯 柳凤娟 《化学研究与应用》 CAS CSCD 北大核心 2015年第7期969-973,共5页
革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重... 革兰氏阴性菌细胞中至少存在八种分泌系统,而每种分泌系统分别由一系列具有特定结构与功能的蛋白质组成。因此,对不同类型的细菌分泌系统蛋白进行深入研究,不仅有助于理解对应的蛋白质分泌机制,对于疾病的诊断与治疗及新药研发也具有重要意义。以氨基酸组成和位置特异性得分矩阵为替代模型,本文构建了一个基于支持向量机构的多元分类器以快速区分不同类型的革兰氏阴性菌分泌系统蛋白。实验结果表明,本方法对I、II及V型分泌系统蛋白具有较好的预测性能。 展开更多
关键词 革兰氏阴性菌 分泌系统蛋白 支持向量机 位置特异性得分矩阵
下载PDF
基于支持向量机的癌细胞经典分泌蛋白与非经典分泌蛋白识别研究 被引量:4
8
作者 余乐正 柳凤娟 +2 位作者 李东海 郭延芝 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期152-156,共5页
基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典... 基于支持向量机算法,本文提出了一种能快速准确区分癌细胞经典分泌蛋白与非经典分泌蛋白的方法.通过严格的特征筛选,氨基酸组成、位置特异性得分矩阵和信号肽组成了最优特征集.测试集检测结果表明,本方法对癌细胞经典分泌蛋白与非经典分泌蛋白具有较强的区分能力,可为寻找到不同种类癌症间通用的生物标志物提供理论参考. 展开更多
关键词 支持向量机 癌症 非经典分泌蛋白 位置特异性得分矩阵 信号肽
下载PDF
基于加权PSSM直方图和随机森林集成的蛋白质交互作用位点预测 被引量:7
9
作者 魏志森 杨静宇 於东军 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第4期379-385,共7页
为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森... 为了提高蛋白质相互作用位点预测的精度,该文基于蛋白质位置特异性得分矩阵(Position specific scoring matrix,PSSM),提出了一种新的加权得分矩阵直方图特征表示方法;针对训练数据的极端不平衡,结合下采样和分类器集成方法,训练随机森林集成分类器。相对于传统的特征,该文所提新特征具有更低的维数,同时拥有更好的鉴别性。分类器集成则缓解了下采样带来的信息丢失,并提高了分类精度。实验结果验证了所述方法是有效的,在标准数据集上的结果优于其他最新的蛋白质相互作用位点预测方法。 展开更多
关键词 蛋白质作用 位置特异性得分矩阵 加权得分矩阵直方图 随机森林 分类器集成
下载PDF
基于多视角特征融合与随机森林的蛋白质结晶预测 被引量:2
10
作者 李强 郑宇杰 《现代电子技术》 北大核心 2015年第8期50-53,共4页
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费... X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(Pse AAC)和伪位置特异性得分矩阵特征(Pse PSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。 展开更多
关键词 蛋白质结晶 伪氨基酸组成 位置特异性得分矩阵 随机森林
下载PDF
基于差分进化算法的MHC-I结合亲和力预测方法
11
作者 丛春雨 王忠英 《电子技术与软件工程》 2015年第22期187-187,共1页
在细胞免疫反应中,抗原表位与MHCs的结合扮演着重要角色。预测多肽与MHC分子结合的准确率已有很大的进步,最近,MHC-多肽的结合预测模型趋向预测结合力亲和力的大小,代替了以前判断多肽是"结合"和"不结合"的预测结果... 在细胞免疫反应中,抗原表位与MHCs的结合扮演着重要角色。预测多肽与MHC分子结合的准确率已有很大的进步,最近,MHC-多肽的结合预测模型趋向预测结合力亲和力的大小,代替了以前判断多肽是"结合"和"不结合"的预测结果,在本文中,使用了差分进化算法与位置特异性得分矩阵相结合的方法来预测多肽与MHC-I的结合亲和力。 展开更多
关键词 主要组织相容性复合体(MHC) 预测结合力 差分进化算法(DE) 位置特异性得分矩阵(PSSM) 多肽
下载PDF
一种快速准确区分Ⅲ型、Ⅳ型分泌效应蛋白的计算方法 被引量:1
12
作者 柳凤娟 杨庆 +2 位作者 陈倩 余乐正 李益洲 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期781-785,共5页
通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪... 通过Ⅲ型、Ⅳ型、Ⅵ型分泌系统,革兰氏阴性菌可将效应蛋白直接注入宿主体内,并导致宿主感染各种疾病.由于Ⅲ型、Ⅳ型分泌效应蛋白均属非经典分泌蛋白,且它们可能具有相似的序列模体或进化保守性,故两者之间难于区分.基于支持向量机和伪位置特异性得分矩阵,本文提出了一种可快速准确识别革兰氏阴性菌Ⅲ型、Ⅳ型效应蛋白的计算方法.测试集实验结果表明,本方法对Ⅲ型、Ⅳ型效应蛋白具有较好的分类效果,可作为辅助工具用于分泌效应蛋白的进一步研究. 展开更多
关键词 革兰氏阴性菌 分泌效应蛋白 支持向量机 位置特异性得分矩阵 留一法
下载PDF
序列蛋白质-GDP绑定位点预测 被引量:2
13
作者 石大宏 何雪 《计算机工程与应用》 CSCD 北大核心 2016年第13期55-59,75,共6页
正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向... 正确地识别蛋白质-二磷酸鸟苷(Guanosine Diphosphate,GDP)绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的,而且会使预测结果偏向大多数类。为了解决这个问题,在基于稀疏表示的位置特异性得分矩阵特征基础上,提出了加权下采样方法来使得样本平衡,采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。 展开更多
关键词 蛋白质-GDP绑定预测 位置特异性得分矩阵 稀疏表示 加权下采样 支持向量机
下载PDF
基于随机下采样和SVR的蛋白质-ATP绑定位点预测 被引量:2
14
作者 余健浩 孙廷凯 《现代电子技术》 北大核心 2015年第4期19-24,共6页
将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题... 将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题本身的特点,在此提出一种基于随机下采样和支持向量回归的蛋白质-ATP绑定位点预测方法。首先,使用滑动窗口抽取蛋白质序列中每个残基的特征,得到一批不平衡的两类样本;其次,应用随机下采样策略,消除正负样本存在的显著不平衡;最后,使用支持向量回归建立预测模型,并选取合适的阈值进行蛋白质-ATP绑定位点的预测。在标准数据集上的实验结果以及与几种最新报道的预测方法的对比结果,验证了本文所述方法的有效性。 展开更多
关键词 蛋白质-ATP绑定位点 位置特异性得分矩阵 滑动窗口 支持向量回归模型 随机下采样
下载PDF
基于序列与结构特征结合的蛋白质与DNA绑定位点预测 被引量:1
15
作者 杨骥 《计算机与现代化》 2016年第1期20-25,共6页
目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及... 目前国内外对于DNA-蛋白质绑定位点预测的研究大多集中在仅以蛋白质序列信息或仅以蛋白质结构信息为基础进行计算,而二者结合所实现的预测效果较差。本文提出一种在蛋白质位置特异性得分矩阵序列特征的基础上,结合蛋白质残基的溶剂可及表面积、相对表面积、深度和突出指数这几个结合效果良好的结构特征的DNA与蛋白质绑定位点预测方法,并使用随机下采样方法解决训练集样本不平衡问题,最后使用支持向量机算法进行预测。实验结果表明,本文方法具有较好的预测能力。 展开更多
关键词 位置特异性得分矩阵 可及表面积 相对表面积 深度与突出指数 随机下采样 支持向量机
下载PDF
基于间隔二肽组分和递归特征消除法的DNA结合蛋白的鉴定
16
作者 汤亚东 刘潇 +2 位作者 刘太岗 谢鹭 陈兰明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2018年第4期453-459,共7页
DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature eliminati... DNA结合蛋白(DNA-binding proteins,DBPs)的鉴定在原核和真核生物的基因和蛋白质功能注释研究中具有十分重要的意义.本研究首次运用间隔二肽组分(gapped-dipeptide composition,Gap DPC)结合递归特征消除法(recursive feature elimination,RFE)鉴定DBPs.首先获得待测蛋白质氨基酸序列的位置特异性得分矩阵(position specific scoring matrix,PSSM),在此基础上提取蛋白质的Gap DPC特征,通过RFE法选择最优特征,然后利用支持向量机(support vector machine,SVM)作为分类器,在蛋白质序列数据集PDB396和LB1068中进行夹克刀交叉验证(jackknife cross validation test).研究结果显示,基于PDB396和LB1068数据集,DBPs预测的准确率、Matthews相关系数、敏感性和特异性分别达到93.43%、0.86、89.04%和96.00%,以及86.33%、0.73、86.49%和86.18%,明显优于文献报道中的相关方法,为DBPs的鉴定提供了新的模型. 展开更多
关键词 DNA结合蛋白 间隔二肽组分 位置特异性得分矩阵 递归特征消除法 支持向量机分类器
下载PDF
基于ACC变换和RFE算法的蛋白质亚核定位预测
17
作者 李小苇 刘太岗 +1 位作者 陶珮莹 王春华 《计算机工程与应用》 CSCD 北大核心 2016年第15期83-87,共5页
获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置... 获取真核细胞中细胞核内蛋白质定位的信息对注解蛋白质功能具有非常重要的意义。针对于利用计算方法预测蛋白质在亚核水平上的定位更具挑战性的问题,提出了基于自互协方差变换与递归特征消除预测蛋白质亚核定位的方法。该方法基于位置特异性得分矩阵利用自互协方差变换构建蛋白质序列的特征向量,采用递归特征消除法进行特征选择,选用支持向量机作为预测工具,并在两个经典数据集SC714和LD504上进行了夹克刀测试。实验结果表明,该方法比大多数已报道的预测方法具有更高的预测准确率。 展开更多
关键词 蛋白质亚核定位 位置特异性得分矩阵 自互协方差变换 递归特征消除
下载PDF
改进CKSAAP结合RFE算法预测蛋白质棕榈酰化位点
18
作者 汤亚东 谢鹭 陈兰明 《计算机工程与应用》 CSCD 北大核心 2019年第5期143-148,共6页
蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的k-spaced氨基酸对组分方法表征蛋白质序列,通过递归特... 蛋白质棕榈酰化是一种可逆的蛋白质翻译后修饰,在蛋白质稳定性和亚细胞定位等方面发挥重要作用。构建了一种预测蛋白质棕榈酰化位点的新模型(PSSM-CKSAAP-RFE)。采用蕴含进化信息的k-spaced氨基酸对组分方法表征蛋白质序列,通过递归特征消除法进行特征选择;基于上述特征训练支持向量机分类器,并采用夹克刀交叉验证法测试模型性能。研究结果显示,训练集和独立测试集的预测准确率、马修斯相关系数、特异性、敏感性和受试者工作特征曲线下面积分别为98.44%、0.94、98.95%、95.65%和0.990,以及98.41%、0.93、99.39%、92.31%和0.994,优于文献中报道的相关方法,为蛋白质棕榈酰化位点的预测提供了一种新模型。 展开更多
关键词 蛋白质棕榈酰化位点 k-spaced氨基酸对组分 位置特异性得分矩阵 支持向量机 递归特征消除
下载PDF
基于序列的蛋白质-GDP结合位点预测
19
作者 徐淑坦 王俊豪 陈明 《中国医学物理学杂志》 CSCD 2022年第11期1425-1430,共6页
蛋白质-GDP(Guanosine Diphosphate)结合位点的预测对蛋白质功能注释与新药发现有非常重要作用。为了提高预测蛋白质-GDP结合位点的准确度,提出一种基于序列的蛋白质-GDP结合位点预测方法,使用位置特异性迭代算法进行多序列对比得到位... 蛋白质-GDP(Guanosine Diphosphate)结合位点的预测对蛋白质功能注释与新药发现有非常重要作用。为了提高预测蛋白质-GDP结合位点的准确度,提出一种基于序列的蛋白质-GDP结合位点预测方法,使用位置特异性迭代算法进行多序列对比得到位置特异性得分矩阵,通过镜像残基可变滑动窗口方法选取蛋白质序列中每个残基的特征向量,利用CNMW(Clustering NearMiss-2 Weighted)下采样解决数据集正负样本的不平衡问题,最后使用支持向量机进行预测。实验结果显示与传统方法相比,本文方法在马修斯相关系数上有显著提升,表明本文方法的有效性和可行性。 展开更多
关键词 蛋白质-GDP结合位点 位置特异性得分矩阵 下采样 滑动窗口 支持向量机
下载PDF
基于聚类的下采样及其在蛋白质-核苷酸绑定位点预测中的应用
20
作者 石大宏 《计算机与数字工程》 2015年第6期972-975,共4页
蛋白质-核苷酸绑定位点预测对于蛋白质功能研究和药物设计有极其重要的作用。单纯依赖生物学实验来获取绑定位点情况的成本大,耗时长。因此,使用模式识别的方法来进行蛋白质-核苷酸预测越来越重要。蛋白质-核苷酸绑定位点预测是一个典... 蛋白质-核苷酸绑定位点预测对于蛋白质功能研究和药物设计有极其重要的作用。单纯依赖生物学实验来获取绑定位点情况的成本大,耗时长。因此,使用模式识别的方法来进行蛋白质-核苷酸预测越来越重要。蛋白质-核苷酸绑定位点预测是一个典型的不平衡学习问题,为了保持样本的平衡性,在稀疏表示方法提取特征的基础上,使用基于聚类的下采样方法进行采样,然后用SVM进行蛋白质-核苷酸绑定位点预测。实验结果说明了方法的可行性和有效性。 展开更多
关键词 位置特异性得分矩阵 稀疏表示 基于聚类的下采样 支持向量机
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部