SIMCA法用于从非同源蛋白一级序列预测其结构类被引量：1

SIMCA method and application in prediction of protein secondary structural classes

导出

摘要蛋白质结构类的正确识别对于其三级结构预测具有十分重要的意义,有必要引入先进的算法提高预测精度。使用SIM-CA 法处理氨基酸组成、自相关系数提取的特征参数以及氨基酸对含量,进行了蛋白质结构类的预测。采用Miyazawa 和Jerni-gan 的疏水值时,All-α、All-β、αβ类的自检验的精度为89%、91%、89%,它检验的精度分别为74%、87%、91%;引入氨基酸对含量后,All-α、All-β、αβ类自检验精度为86%、89%、90%,它检验的精度为77%、88%、93%。SIMCA 的预测结果好于Bayes-ian 识别函数法,氨基酸对的引入可以提高预测精度。 Protein structural classes prediction plays important role in three-dimensional structure prediction,advanced algorithmshould be introduced.Amino acid compositions,the auto correlation function and amino acids pairs compositions are used to describesequence information encoding in protein,then SIMCA method is introduced to predict the secondary classes of protein.Self-consisten-cy prediction accuracy rates of All-α,All-β,αβ are 89%,91%,89%,and cross-validation accuracy rates are 74%,87%,91%when Miyazawa and Jernigan's index is used.After amino acids pairs compositions are introduced,self-consistency prediction accuracyrates of All-α,All-β,αβare 86%,89%,90%,and cross-validation accuracy rates are 77%,88%,93%.The result is better thanthe method based bayesian discriminant function and the introduction of amino acids pairs compositions can improve prediction accura-cy.

作者高守国

机构地区东南大学公共卫生学院

出处《计算机与应用化学》 CAS CSCD 北大核心 2004年第5期714-716,共3页 Computers and Applied Chemistry

关键词结构类预测 SIMCA 氨基酸对含量 prediction of secondary structural Classes SIMCA amino acids pairs compositions

分类号 TQ754 [化学工程]

引文网络
相关文献

参考文献2

1秦红珊,杨新岐,曹文斗.从非同源蛋白质的一级序列预测其结构类[J].生物物理学报,2002,18(2):213-222. 被引量：8
2李晓琴,罗辽复.蛋白质结构型的定义和识别[J].生物化学与生物物理进展,2002,29(1):124-127. 被引量：5

二级参考文献1

1李晓琴,罗辽复.氨基酸组成聚类、蛋白质结构型和结构型的预测[J].生物物理学报,1998,14(4):729-736. 被引量：14

共引文献11

1姜小莹,朱俊东,李晓波,张同亮.使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类[J].生物物理学报,2008,24(1):43-48. 被引量：2
2王海瑜,潘泉,张洪才,张绍武.基于多支持向量机的DT算法研究及应用[J].计算机工程与应用,2004,40(18):83-84. 被引量：2
3王海瑜,潘泉,张洪才.一种改进的加权融合算法[J].计算机工程与应用,2004,40(19):66-67.
4任力锋,张波,刘辉.蛋白质序列信息的提取与蛋白质结构预测[J].北京生物医学工程,2005,24(3):237-238. 被引量：5
5邵壮超,张绍武,潘泉,施建宇,姜涛.基于一种动态特征选择融合算法的蛋白质结构类预测[J].世界科技研究与发展,2005,27(6):53-57.
6张振慧,王正华,王勇献.蛋白质的分组重量编码及在结构型预测的应用[J].计算机工程与应用,2007,43(7):38-40. 被引量：1
7吕庆章,牛静,王珂芳,李小娟.蛋白质特征曲线的研究[J].生物信息学,2009,7(2):133-136.
8吕龙君,赵伟,柴华,李春.基于单字符周期性的蛋白质结构类型预测[J].中国科技信息,2010(11):204-205.
9李晓琴,王守源,罗辽复.蛋白质的二级结构序列和结构型[J].内蒙古大学学报（自然科学版）,2002,33(1):21-25. 被引量：3
10王守源,李晓琴,罗辽复.氨基酸分类与蛋白质二级结构相关性[J].内蒙古大学学报（自然科学版）,2002,33(4):423-427. 被引量：7

同被引文献27

1邵勇,杨少波,王孟薇,吴本俨,尤纬缔,李红.胃癌基因表达谱的cDNA微阵列与聚类分析[J].中华医学遗传学杂志,2004,21(2):110-115. 被引量：10
2卢伟,陈国松,张红漫,张之翼,蒋皎梅,华毅超,刘泼.化学模式识别及其在水质分类中的应用[J].化工时刊,2004,18(7):43-45. 被引量：1
3崔秀君,张卓勇,袁星,苏忠民,刘思东.主成分分析-神经网络方法用于硝基苯及其同系物的QSAR研究[J].计算机与应用化学,2005,22(11):1038-1040. 被引量：9
4梁桂兆,周鹏,周原,张巧霞,李志良.一组新氨基酸描述子用于肽定量构效关系研究[J].化学学报,2006,64(5):393-396. 被引量：13
5Guo Q, Wu w and Massart DL, et al. Feature selection in principal component analysis of analytical data. Chemom Intel. Lab Syst,2002, 61:123 - 132,
6Idborg-Bjorkman H, Per-Olof E and Kvalherim OM, et al, Screening of biomarkers in rat urine using LCP electrospray ionization-MS and two-way data analysis. Anal Chem, 2003, 75:4784 -4792.
7Barros AS and Rufledge DN. Genetic algorithm applied to the selection of principal components. Chemom Intel Lab Syst, 1998,40:65-81.
8Leao MBC, Pavao AC and Eapinoza VAA, et al. A multivariate model of chemical carcinogenesis. J Mol Struc-Theochem, 2005,719 : 129 - 135.
9Chapman S, Schenk P and Kazan K, et al. Using biplots interpret gene expression pattern in plants. Bioinformatics, 2001, 18:202 -204.
10Eisen M, Spellman P and Brown P, et al. Cluster analysis and display of genome-wide expression patterns. PNAS, 1998, 95 : 14863- 14868.

引证文献1

1王岚,陈晶,王睿,卢小泉.几种模式识别方法在生物信息学中的应用[J].计算机与应用化学,2007,24(1):53-55. 被引量：8

二级引证文献8

1罗来成,黄榕波,王建红.用人工神经网络研究情志活动异常时下丘脑-垂体-卵巢轴紊乱机理[J].时珍国医国药,2009,20(5):1064-1066. 被引量：9
2卢宏.基于模式识别的正交试验数据分析及其应用[J].计算机与应用化学,2009(10):1253-1256.
3丁德武,丁彦蕊,陆克中,须文波,黄海生.重建代谢网络及其结构与功能的分析[J].计算机与应用化学,2010,27(5):591-596. 被引量：11
4张华,苏越,王磊,张琴,苏式兵,刘平.基于SIMCA法的肝炎后肝硬化中医证候判别研究[J].中国中西医结合杂志,2011,31(2):177-181. 被引量：8
5刘伯高.基于连续隐马尔柯夫模型的模式识别技术及其应用[J].计算技术与自动化,2015,34(1):126-130.
6王挥,宋菲,曹飞宇,沈晓君,张玉锋,赵松林.基于荧光光谱的初榨椰子油掺假检测技术研究[J].食品工业,2017,38(5):293-296. 被引量：7
7黄沐也.试论生物信息学中模式识别技术的应用与发展[J].中国高新区,2017,0(24):35-35. 被引量：1
8孙沛沛,钱朝菊,尹晓月,范兴科,王进,燕霞,李小军,马小飞,王涛.半干旱沙地蒿类植被建成过程中土壤理化性质变化规律[J].土壤科学,2019,7(3):210-219. 被引量：1

1张昆,高振,李霜,付永前,黄和,韦萍,嵇松杨.基于Desirability函数法对米根霉发酵制备富马酸的多目标优化[J].中国生物工程杂志,2008,28(4):59-64. 被引量：7
2沈一丁,李小瑞,徐学诚,常新华,唐会儒.SRL树脂的合成及复鞣试验[J].皮革科技,1989,18(2):8-10. 被引量：1
3叶龙祥,刘清斌.黑曲霉发酵生产壳聚糖工艺研究[J].化学与生物工程,2007,24(7):45-48. 被引量：3
4金洪顺,楼惠琴,蒋世春,白骅.从红豆杉中提取紫杉醇的工艺研究[J].广州化工,2014,42(10):88-91. 被引量：5
5张正风.基于LS-SVM苯乳酸发酵过程的建模[J].武汉工程大学学报,2016,38(4):333-336. 被引量：1
6李景森,庄英萍,王永红,郭元昕,储炬.基于参数相关分析的头孢菌素C发酵过程溶氧调控策略[J].华东理工大学学报（自然科学版）,2007,33(6):788-793. 被引量：2
7庄英萍,陈斌,晏秋鸿,储炬,郭美锦,张嗣良.梅岭霉素发酵过程参数相关分析和优化[J].中国抗生素杂志,2004,29(1):1-3. 被引量：2
8杨兰,董鸿晔.BP神经网络与遗传算法结合优化培养基配方应用研究[J].黑龙江医药,2011,24(3):371-372.
9峰值识别的SVM模型及在时用水量预测中的应用[J].中国学术期刊文摘,2005,11(12):189-189.
10徐美红,张学才,李丽,杨忠连,陈明强,刘玉林.白腐真菌处理硝基苯化合物的机理初探[J].化学与生物工程,2006,23(8):40-42. 被引量：3

计算机与应用化学

2004年第5期

浏览历史

内容加载中请稍等...

SIMCA法用于从非同源蛋白一级序列预测其结构类被引量：1

参考文献2

二级参考文献1

共引文献11

同被引文献27

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

SIMCA法用于从非同源蛋白一级序列预测其结构类 被引量：1

参考文献2

二级参考文献1

共引文献11

同被引文献27

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

SIMCA法用于从非同源蛋白一级序列预测其结构类被引量：1