支持向量机及组合预测在蛋白质四级结构分类中的应用

Classification of Protein Quaternary Structure based on Support Vector Machines and Combinatorial Forecast

下载PDF

导出

摘要目的:基于支持向量机建立一个自动化识别新肽链四级结构的方法,提高现有方法的识别精度。方法:改进4种已有的蛋白质一级序列特征值提取方法,采用线性和非线性组合预测方法建立一个有效的组合预测模型。结果:以同源二聚体及非同源二聚体为例,对4种特征值提取方法进行改进后其分类精度均提升了2～3%;进一步实施线性与非线性组合预测后,其分类精度再次提高了2～3%,使独立测试集的分类精度达到了90%以上。结论:4种特征值提取方法均较好地反应出蛋白质一级序列包含四级结构信息,组合预测方法能有效地集多种特征值提取方法优势于一体。 Objective： To establish a method of automatically identifying protein structures based on support vector machine for improving the present classification accuracies. Methods： The former four methods of feature extraction from the amino acid sequences were improved, and then an effective combinatorial forecast model was established based on linear and non-linear method. Results： The classification precision of the four improved models has increased by 2-3 % over before.Then,combinatorial forecast was further introduced, and the classification precision has increased by 2-3 % again.Finally,the precision of independent testing set exceeded 90 %. Conclusion： The results indicate that protein primary sequence contains quaternary structure information. And the combinatorial forecast method can effectively integrate with several kinds of methods of feature value extraction in the primary sequences.

作者谭显胜袁哲明周铁军熊洁仪王春娟

机构地区湖南农业大学生物安全科学技术学院湖南农业大学理学院

出处《现代生物医学进展》 CAS 2008年第4期646-648,637,共4页 Progress in Modern Biomedicine

基金国家自然科学基金(No.30570351) 教育部新世纪优秀人才支持计划(NCET-06-0710)

关键词蛋白质四级结构分类支持向量机组合预测 Protein quaternary structure Classification Support vector machines Combinatorial forecast

分类号 Q518.3 [生物学—生物化学]

引文网络
相关文献

参考文献8

1鲁湛,丁晓青.基于分类器判决可靠度估计的最优线性集成方法[J].计算机学报,2002,25(8):890-895. 被引量：9
2施建宇,潘泉,张绍武,程咏梅.基于氨基酸组成分布的蛋白质同源寡聚体分类研究[J].生物物理学报,2006,22(1):49-56. 被引量：9
3张绍武,潘泉,陈润生,张洪才.基于支持向量机的蛋白质同源寡聚体分类研究[J].生物化学与生物物理进展,2003,30(6):879-883. 被引量：15
4梅虎,周原,孙立力,李志良.氨基酸结构描述子矢量VHSE及其在肽QSAR中的应用[J].化学通报,2005,68(7):534-540. 被引量：25
5梅虎,周原,孙立力,李志良.一种新的氨基酸描述子及其在肽QSAR中的应用[J].物理化学学报,2004,20(8):821-825. 被引量：25
6丁俊杰,丁晓琴,赵立峰,陈冀胜.多肽定量构效关系与分子设计[J].化学进展,2005,17(1):130-136. 被引量：9
7张绍武,潘泉,张洪才,张云龙,王海瑜.基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究[J].生物物理学报,2003,19(2):171-175. 被引量：7
8王春娟,谭显胜,袁哲明,熊洁仪.头孢菌素类抗生素的定量构效关系研究[J].现代生物医学进展,2007,7(11):1718-1722. 被引量：1

二级参考文献158

1李程雄,丁月华,文贵华.SVM-KNN组合改进算法在专利文本分类中的应用[J].计算机工程与应用,2006,42(20):193-195. 被引量：22
2刘红艳,覃礼堂,易忠胜,刘树深.黄酮类醛糖还原酶抑制剂的三维定量构效关系研究[J].现代生物医学进展,2006,6(12):13-16. 被引量：5
3阎隆飞孙之荣.蛋白质分子结构[M].北京：清华大学出版社,2000..
4Anfinsen CB, Haber E, Sela M, et al. The kinetics of formation of native ribonuclease during oxidation of the reduced polypepfide chain[J]. Proc Nail Acad Sci USA, 1961,47: 1309-1314.
5Klotz IM, Darnall DW, Langerman NR. The protein, 3rd edition[M]. New York: Academic Press, 1975,1:293--411.
6Price NC. Assembly of multi-subtmit structure[M]. New York:Oxford University Press, 1994.
7Robert G. Prediction of quaternary structure from primary structure[J]. Biolnformatics, 2001,17:551-556.
8Vapnik V. The nature of statistical loaming theory[M]. NewYork: Springer, 1995.
9Vapnik V. Statistical learning theory[M]. New York: Wiely,1998.
10Brown M, Grundy W, Lin D, et al. Knowledge-based analysis of microarray gene expression data by using support vector machines[J]. Proc Nail Acad Sci USA, 2000,97:262-267.

共引文献76

1王飞飞,张光亚,方柏山,张婷婷.G／11家族木聚糖酶特征序列与其最适温度定量关系的研究[J].计算机与应用化学,2007,24(12):1638-1642. 被引量：2
2邱德红,陈传波,金先级.基于算法随机性理论和奇异描述的置信学习机器[J].计算机研究与发展,2004,41(9):1586-1592. 被引量：10
3王飞,李在铭.序列图像中动目标标示的多分类器自适应融合识别[J].信号处理,2004,20(4):410-412.
4王娴,李骜,王明会,冯焕清.基于支持向量机方法的蛋白质氨基酸残基可溶性预测[J].生物物理学报,2005,21(1):60-64. 被引量：2
5张云龙,潘泉,张洪才.一种基于SVR的综合预测方法及应用[J].空军工程大学学报（自然科学版）,2005,6(3):19-21.
6梁桂兆,梅虎,周原,李志良.计算机辅助药物设计中的多维定量构效关系模型化方法[J].化学进展,2006,18(1):120-127. 被引量：18
7施建宇,潘泉,张绍武,梁彦.基于支持向量机融合网络的蛋白质折叠子识别研究[J].生物化学与生物物理进展,2006,33(2):155-162. 被引量：19
8施建宇,潘泉,张绍武,程咏梅.基于氨基酸组成分布的蛋白质同源寡聚体分类研究[J].生物物理学报,2006,22(1):49-56. 被引量：9
9印家健,李梦龙,文志宁,潘义,刁元波.支持向量回归用于氨基酸描述符在肽QSAR建模中的性能评价[J].四川大学学报（自然科学版）,2006,43(2):396-402. 被引量：6
10张绍武,潘泉,程咏梅,施建宇.基于一种新的特征提取法和支持向量机的膜蛋白分类研究[J].计算机与应用化学,2006,23(4):294-298. 被引量：4

1张绍武,潘泉,张洪才,张云龙,王海瑜.基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究[J].生物物理学报,2003,19(2):171-175. 被引量：7
2张振慧,王正华,王勇献.基于氨基酸和二肽组成的蛋白质四级结构分类研究[J].生物信息学,2007,5(2):49-52. 被引量：1
3宋杰,唐焕文.预测同源寡聚蛋白质的支持向量机方法(英文)[J].计算机与应用化学,2004,21(6):789-794. 被引量：5
4刘春巧,张永忠,庄贵洵,孙效文,李云龙.转基因鱼构建模式的研究II.构建转基因鱼的几个影响因素(英文)[J].Developmental and Reproductive Biology,1997,6(2):21-27.
5斑马在南京开设办公室[J].中国防伪报道,2011(1):72-72.
6王彤,杨志珍,曹晓夏.基于线性降维方法的蛋白质四级结构类型预测[J].上海第二工业大学学报,2013,30(1):12-17. 被引量：2
7张光亚,葛慧华,方柏山.基于不同序列特征值预测氧化还原酶辅酶类型的研究[J].计算机与应用化学,2008,25(5):545-548.
8张雷,刘世荣,孙鹏森,王同立.气候变化对物种分布影响模拟中的不确定性组分分割与制图--以油松为例[J].生态学报,2011,31(19):5749-5761. 被引量：34
9姜雪,于巍.基于优化特征参量的蛋白质βαβ模体识别分析[J].江苏农业科学,2015,43(2):20-23.
10姜彬,王正华,王勇献,贺细平.k子串离散源结合加权KNN算法预测膜蛋白类型[J].激光生物学报,2009,18(1):121-127.

现代生物医学进展

2008年第4期

浏览历史

内容加载中请稍等...

支持向量机及组合预测在蛋白质四级结构分类中的应用

参考文献8

二级参考文献158

共引文献76

相关作者

相关机构

相关主题

浏览历史