期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
Using the improved position specific scoring matrix and ensemble learning method to predict drug-binding residues from protein sequences
1
作者 Juan Li Yongqing Zhang +5 位作者 Wenli Qin Yanzhi Guo Lezheng Yu Xuemei Pu Menglong Li Jing Sun 《Natural Science》 2012年第5期304-312,共9页
Identification of the drug-binding residues on the surface of proteins is a vital step in drug discovery and it is important for understanding protein function. Most previous researches are based on the structural inf... Identification of the drug-binding residues on the surface of proteins is a vital step in drug discovery and it is important for understanding protein function. Most previous researches are based on the structural information of proteins, but the structures of most proteins are not available. So in this article, a sequence-based method was proposed by combining the support vector machine (SVM)-based ensemble learning and the improved position specific scoring matrix (PSSM). In order to take the local environment information of a drug-binding site into account, an improved PSSM profile scaled by the sliding window and smoothing window was used to improve the prediction result. In addition, a new SVM-based ensemble learning method was developed to deal with the imbalanced data classification problem that commonly exists in the binding site predictions. When performed on the dataset of 985 drug-binding residues, the method achieved a very promising prediction result with the area under the curve (AUC) of 0.9264. Furthermore, an independent dataset of 349 drug- binding residues was used to evaluate the pre- diction model and the prediction accuracy is 84.68%. These results suggest that our method is effective for predicting the drug-binding sites in proteins. The code and all datasets used in this article are freely available at http://cic.scu.edu.cn/bioinformatics/Ensem_DBS.zip. 展开更多
关键词 DRUG-BINDING SITE prediction Position Specific SCORING Matrix ENSEMBLE learning support vector machine
下载PDF
ON NETWORK-BASED KERNEL METHODS FOR PROTEIN-PROTEIN INTERACTIONS WITH APPLICATIONS IN PROTEIN FUNCTIONS PREDICTION 被引量:1
2
作者 Limin LI Waiki CHING +1 位作者 Yatming CHAN Hiroshi MAMITSUKA 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2010年第5期917-930,共14页
Predicting protein functions is an important issue in the post-genomic era. This paper studies several network-based kernels including local linear embedding (LLE) kernel method, diffusion kernel and laplacian kerne... Predicting protein functions is an important issue in the post-genomic era. This paper studies several network-based kernels including local linear embedding (LLE) kernel method, diffusion kernel and laplacian kernel to uncover the relationship between proteins functions and protein-protein interactions (PPI). The author first construct kernels based on PPI networks, then apply support vector machine (SVM) techniques to classify proteins into different functional groups. The 5-fold cross validation is then applied to the selected 359 GO terms to compare the performance of different kernels and guilt-by-association methods including neighbor counting methods and Chi-square methods. Finally, the authors conduct predictions of functions of some unknown genes and verify the preciseness of our prediction in part by the information of other data source. 展开更多
关键词 Diffusion kernel kernel method Laplacian kernel local linear embedding (LLE) kernel protein function prediction support vector machine.
原文传递
支持向量机程序SVMProt预测SARS病毒蛋白质的功能 被引量:4
3
作者 蔡从中 韩连漪 +1 位作者 王万录 陈宇综 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第9期148-150,共3页
对SARS冠状病毒蛋白质功能的有效识别将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于... 对SARS冠状病毒蛋白质功能的有效识别将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于SARS冠状病毒蛋白质及其他种类蛋白质的功能预测。对SARS冠状病毒中至今仍未知其功能的蛋白质ORF13的功能进行了预测,结果显示ORF13是一种可能与DNA结合的核蛋白并兼有病毒体内结构蛋白的功能。 展开更多
关键词 非典 SARS冠状病毒蛋白质 蛋白质功能 蛋白质功能预测 支持向量机
下载PDF
电梯群控系统交通需求的迭代学习预测方法 被引量:3
4
作者 杨祯山 邵诚 马海丰 《控制与决策》 EI CSCD 北大核心 2008年第3期302-305,309,共5页
提出对时变垂直交通需求的智能化迭代学习预测方法.该方法采用最小二乘支持向量机技术,动态预测未来的交通需求及其变化规律.在此基础上,提出以电梯交通需求净增量及其变化率强度为依据的交通模式划分的新规则.通过构造滤波函数的方法... 提出对时变垂直交通需求的智能化迭代学习预测方法.该方法采用最小二乘支持向量机技术,动态预测未来的交通需求及其变化规律.在此基础上,提出以电梯交通需求净增量及其变化率强度为依据的交通模式划分的新规则.通过构造滤波函数的方法获取交通需求变化的主要信息,对交通模式量化识别,得到主要交通模式区间的临界点.仿真实验表明了该方法的有效性. 展开更多
关键词 电梯群控系统 交通需求预测 迭代学习 最小二乘支持向量机 滤波函数 交通模式识别
下载PDF
基于支持向量机的交互检验储层预测 被引量:14
5
作者 张向君 张晔 《石油物探》 EI CSCD 北大核心 2018年第4期597-600,共4页
基于统计学习理论的支持向量机(support vector machine,SVM)是有限样本情况下的机器学习方法,具有严格的理论基础,能较好地解决小样本、非线性、高维数和局部极小点等问题。在地震储层预测中,影响支持向量机应用效果的主要因素在于惩... 基于统计学习理论的支持向量机(support vector machine,SVM)是有限样本情况下的机器学习方法,具有严格的理论基础,能较好地解决小样本、非线性、高维数和局部极小点等问题。在地震储层预测中,影响支持向量机应用效果的主要因素在于惩罚因子及核函数参数的设置,其值设置过小或过大,都会使估计函数的泛化能力变差,降低储层预测精度。为提高支持向量机在储层预测中的应用效果,将已知样本随机划分为若干组,依次选其中的一组作为检验样本,其余样本作为学习样本,交互检验惩罚因子及核函数参数对储层预测精度的影响;优选惩罚因子及核函数参数,提高支持向量机储层预测精度。通过实际资料应用,验证了方法的有效性。 展开更多
关键词 芰持向量机 机器学习 惩罚因子 核函数 储层预测
下载PDF
基于NC-SVM的酵母蛋白功能预测研究
6
作者 王婷婷 黄燕 《现代农业科技》 2011年第7期12-14,16,共4页
蛋白质功能的预测是当前生物信息技术的一个重要研究方向,它广泛应用于分析新发现蛋白质的功能及人工合成的蛋白质功能。利用酵母蛋白相互作用数据,首先针对传统的基于支持向量机和基于邻近投票法的功能预测法分析了它们各自的优劣性,... 蛋白质功能的预测是当前生物信息技术的一个重要研究方向,它广泛应用于分析新发现蛋白质的功能及人工合成的蛋白质功能。利用酵母蛋白相互作用数据,首先针对传统的基于支持向量机和基于邻近投票法的功能预测法分析了它们各自的优劣性,然后研究出结合2种预测方法的优势的NC-SVM法对酵母蛋白的功能进行预测,采用科学的评价方法,通过反复试验并对结果进行分析,发现这种新方法的预测结果优于单独使用前2种,而且具有一定的稳定性。 展开更多
关键词 酵母蛋白 支持向量机 邻近投票法 功能预测
下载PDF
蛋白质二级结构预测的多核学习方法 被引量:7
7
作者 连云涓 熊惠霖 《计算机应用》 CSCD 北大核心 2013年第A01期43-45,共3页
核方法应用于蛋白质二级结构预测已经有数年的历史。不过,基于单核的分类器只能将所有的特征一并处理,而非区别对待以利用其特性。为了将不同的特征融合,提出一种多核学习的方法,以实验方法对比单核和多核学习在蛋白质二级结构预测效果... 核方法应用于蛋白质二级结构预测已经有数年的历史。不过,基于单核的分类器只能将所有的特征一并处理,而非区别对待以利用其特性。为了将不同的特征融合,提出一种多核学习的方法,以实验方法对比单核和多核学习在蛋白质二级结构预测效果上的差别,并提出了多核学习方法可改进现有的核分类器。 展开更多
关键词 多核学习 核方法 蛋白质二级结构预测 支持向量机 生物信息学
下载PDF
面向蛋白质功能位点识别的机器学习平台构建 被引量:3
8
作者 胡敏菁 吴建盛 +2 位作者 施识帆 刘宏德 孙啸 《生物信息学》 2010年第1期12-15,共4页
有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vectormachine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包... 有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vectormachine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包括序列的基本信息、物化特征、结构信息及序列保守性特征等),以编码好的样本作为训练数据,利用SVM进行训练,得到敏感性、特异性、Matthew相关系数、准确率及ROC曲线等评价指标,反复测试,得到评价指标最优的SVM模型后,便可以用来预测蛋白质序列上的功能位点。该平台除了应用在预测蛋白质功能位点之外,还可以应用于疾病相关单核苷酸多态性(SNP)预测分析、预测蛋白质结构域分析、生物分子间的相互作用等。 展开更多
关键词 蛋白质功能位点预测 机器学习 支持向量机
下载PDF
支持向量机在效益函数预报中的应用 被引量:1
9
作者 金侃 袁景淇 《化工自动化及仪表》 EI CAS 2006年第1期11-13,共3页
采用支持向量机(SVM)技术对效益函数进行预报,并基于滚动学习-预报策略处理过程的时变特性。最后结合青霉素生产实际数据,对罐批效益函数进行在线预报,结果显示了SVM预报方法的有效性和鲁棒性。
关键词 效益函数预报 支持向量机 滚动学习-预报 青霉素 在线预报
下载PDF
基于深度学习和支持向量机的基因结合蛋白预测 被引量:1
10
作者 陈佐瓒 徐兵 +1 位作者 丁小军 甘井中 《济南大学学报(自然科学版)》 CAS 北大核心 2021年第5期428-432,共5页
针对传统的方法对蛋白质预测的精度低且需要人工提取环节等问题,提出一种基于深度学习和支持向量机的基因结合蛋白预测算法;该算法将卷积神经网络与门控循环单元结合,搜索蛋白质序列,保留蛋白质序列中氨基酸的位置依赖性,利用支持向量... 针对传统的方法对蛋白质预测的精度低且需要人工提取环节等问题,提出一种基于深度学习和支持向量机的基因结合蛋白预测算法;该算法将卷积神经网络与门控循环单元结合,搜索蛋白质序列,保留蛋白质序列中氨基酸的位置依赖性,利用支持向量机代替神经网络的Softmax分类器对蛋白质的特征序列进行预测;将该模型分别在基准数据集DBP2858和PDB14189上进行对比实验。结果表明,该模型具有更好的脱氧核糖核酸结合蛋白预测能力,并且预测精度和效率均较高。 展开更多
关键词 深度学习 支持向量机 脱氧核糖核酸结合蛋白 蛋白质预测
下载PDF
基于支持向量回归方法的蛋白残基可溶性预测
11
作者 许文龙 李骜 +2 位作者 王明会 江朝晖 冯焕清 《中国生物医学工程学报》 CAS CSCD 北大核心 2007年第1期1-5,共5页
介绍了一种从蛋白质序列预测残基相对可溶性的新方法。该方法基于支持向量回归,并将序列局部信息作为输入。不同于先前的大部分预测方法仅对特定的蛋白残基相对可溶性进行状态分类,该方法预测了相对可溶性的连续值,从而比状态分类保留... 介绍了一种从蛋白质序列预测残基相对可溶性的新方法。该方法基于支持向量回归,并将序列局部信息作为输入。不同于先前的大部分预测方法仅对特定的蛋白残基相对可溶性进行状态分类,该方法预测了相对可溶性的连续值,从而比状态分类保留了蛋白质三维结构的更多信息。本研究对RS-126,Manesh-215和CB-513三个数据集进行了测试,通过比较不同的参数及窗宽模型来获得最佳结果,采用平均绝对误差、相关系数等参数来衡量预测效果,同时与多层反馈神经网络方法(RVP-Net)的实验结果比较,在3-fold情况下三个数据集预测结果的平均绝对误差均有降低,相关系数均有提高。另外,该算法采用了多序列比对作为输入,效果比单序列有所提高。采用该方法,对CB-513数据集平均绝对误差可以达到16.8%、相关系数为0.562,而用RVP-Net方法分别为18.8%和0.480。这些结论表明支持向量回归方法是蛋白质序列分析的一种有效工具。 展开更多
关键词 相对可溶性 支持向量机 机器学习 蛋白质结构预测 生物信息学
下载PDF
基于类不平衡学习的蛋白质与金属离子交互位点预测 被引量:1
12
作者 乔梁 谢冬青 《南京理工大学学报》 EI CAS CSCD 北大核心 2018年第6期707-715,共9页
为了提高蛋白质与金属离子的交互位点(PMIIS)预测的准确率,从解决数据分布不平衡问题出发,提出了1种结合下采样与上采样方法的类不平衡学习算法。同时对多数类样本与少数类样本进行采样,在补充少数类样本信息的同时,减少多数类样本的冗... 为了提高蛋白质与金属离子的交互位点(PMIIS)预测的准确率,从解决数据分布不平衡问题出发,提出了1种结合下采样与上采样方法的类不平衡学习算法。同时对多数类样本与少数类样本进行采样,在补充少数类样本信息的同时,减少多数类样本的冗余信息。基于该文类不平衡学习算法与支持向量机(SVM),设计了1种基于序列信息的预测方法。为了客观评价PMIIS的预测性能,构建了领域内较为完备的、含有蛋白质与Zn^(2+)、Ca^(2+)与Fe^(3+)交互位点的标准数据集。在此数据集上的实验结果表明,该文预测方法在蛋白质与Zn^(2+)、Ca^(2+)与Fe^(3+)交互位点预测问题上的平均马氏相关系数(MCC)为0.646,优于TargetS与IonCom。 展开更多
关键词 类不平衡学习 蛋白质与金属离子 交互位点 预测 支持向量机
下载PDF
基于模糊支持向量机的赖氨酸糖化位点预测
13
作者 宋一明 鞠哲 张万里 《沈阳航空航天大学学报》 2023年第3期63-70,共8页
能否准确识别糖化位点对理解糖化的分子机制有着重要意义。传统的实验方法工作量大、耗时长,因此迫切需要开发计算辅助方法来预测糖化位点。设计了一种新的模糊支持向量机算法,该算法放大了重要特征与弱相关特征间的权重之差,同时考虑... 能否准确识别糖化位点对理解糖化的分子机制有着重要意义。传统的实验方法工作量大、耗时长,因此迫切需要开发计算辅助方法来预测糖化位点。设计了一种新的模糊支持向量机算法,该算法放大了重要特征与弱相关特征间的权重之差,同时考虑了样本内部的分布情况,能够有效地处理糖化修饰位点预测中含有噪声数据的问题。基于所提出的模糊支持向量机算法结合双剖面贝叶斯(Bi-Profile Bayes,BPB)特征提取方法构建了一个新的赖氨酸糖化位点的模型——FSVM_GlySite。十折交叉验证结果表明,FSVM_GlySite的预测效果优于现有的几种糖基化位点预测器。 展开更多
关键词 糖化位点预测 模糊支持向量机 隶属度函数 特征加权 赖氨酸糖化
下载PDF
机器学习方法在植物基因组信息预测中的研究现状
14
作者 张兆旭 管思彤 +5 位作者 林一鸣 苏培森 黄思罗 孟宪勇 柳平增 颜君 《生命科学》 CSCD 2024年第3期302-315,共14页
随着高通量测序技术的飞速发展,植物基因组学研究目前已经积累了海量多组学数据。因此如何开发和改进相关处理软件工具,从而有效利用这些海量数据发掘有用的生物学信息,成为当下亟需解决的重要科学问题。其中机器学习方法凭借其显著的... 随着高通量测序技术的飞速发展,植物基因组学研究目前已经积累了海量多组学数据。因此如何开发和改进相关处理软件工具,从而有效利用这些海量数据发掘有用的生物学信息,成为当下亟需解决的重要科学问题。其中机器学习方法凭借其显著的预测、分类、数据挖掘和集成能力,在此领域受到广泛关注。本文系统综述了不同类型机器学习方法的基本原理和流程,以及这些方法在植物基因组功能预测中的研究进展,重点总结了机器学习模型在植物分子相互作用预测、重要功能位点预测、功能注释、作物育种等方面的应用成果,并展望了该领域未来的发展方向和应用前景。本文有助于植物研究者快速了解和应用机器学习方法,从而推进植物遗传相关机制的研究和作物性状改良。 展开更多
关键词 机器学习 植物基因组预测 蛋白质相互作用 分子位点预测 功能注释 作物育种
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部