蛋白质中三联氨基酸数与二级结构数的模型研究被引量：1

The Model Study Between the Number of Tria-coupled Amino Acid and the Number of Protein Secondary Structure

下载PDF

导出

摘要蛋白质的一级结构或序列与二级结构的关系在蛋白质结构研究中是很重要的,通过建立模型的方法来研究这种关系.在文献中已有的模型(蛋白质一级结构中的二联氨基酸与蛋白质二级结构的模型)的基础上,建立了蛋白质一级结构中的三联氨基酸个数与蛋白质二级结构个数模型.该模型能够较准确地反映蛋白质的一级结构或序列与蛋白质的二级结构的关系,比较适合应用于氨基酸序列长度变化较大的建模数据,同二联氨基酸与二级结构模型比较,由于三联氨基酸含有更多氨基酸之间的耦合信息,该模型的拟合精度更高.由于蛋白质一级结构中的三联氨基酸的种类数很大(为4200),用以建模的变量数就很大,同时从DSSP数据库得到的样本量也很大(为11600),用以建模的数据量很大.研究结果表明,PLS变量筛选法是一种建立大数据模型有效的方法,可有效地处理变量数为4200,样本数为11600这样大数据量的建模问题. The relation between protein sequence and protein secondary structure is very important, which has been studied by the method of building the model. Based on the models （between pair-coupled amino acid and protein secondary structure） in literature, the models between the number of tria-coupled amino acid in protein sequence and the number of protein secondary structure have been built. The models are more accurately reflect the relation between protein sequence and protein secondary structure. The models are more suitable to deal with the data in which the length of protein sequence varies a lot. Comparing with the models between pair- coupled amino acid and protein secondary structure, the models contain more information about coupling effect among varies kinds of amino acids, and therefore are of the higher fitting accuracy. The data set in the research is very large, because the kinds of tria-coupied amino acid in protein sequence are very big （4 200） and the number of samples from DSSP database is also very large （11 BOO）. The results indicate that the PLS variable selection method is effective to deal with the huge data modeling problem in which the number of variables is 4 200 and the number of samples is 11 600.

作者朱尔一

机构地区厦门大学化学化工学院

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2009年第5期704-708,共5页 Journal of Xiamen University：Natural Science

基金福建省自然科学基金(X0750052) 近海海洋环境科学国家重点实验室(厦门大学)开放项目资助

关键词蛋白质二级结构预测偏最小二乘法变量筛选海量数据建模三联氨基酸 protein secondary structure prediction PLS variable selection huge data modeling tria-coupled amino acid

分类号 O604 [理学—化学]

引文网络
相关文献

参考文献6

1Chou Kuoehen. Using pair - coupled amino acid eomposi - tion to predict protein secondary structure eontent [J]. Journal of Protein Chemistry,1999,18(4):473--480.
2朱尔一,林燕.利用偏最小二乘法的一种变量筛选法[J].计算机与应用化学,2007,24(6):741-745. 被引量：8
3朱尔一,林燕,庄赞勇.偏最小二乘变量筛选法在毒品来源分析中的应用[J].分析化学,2007,35(7):973-977. 被引量：8
4Chen Chao,Tian Yuanxin, Zou Xiaoyong, et al. Prediction of protein secondary structure content using support vector maehine[J ]. Talanta, 2007,71 (5):2069-- 2073.
5Wolfgan Kabsch, Christian Sander. Dictionary of protein secondary structure: pattern recognition of hydrogen- bonded and geometrical feature[J]. Biopolymer, 1983,22 (12) :2577--2637.
6Cuff J A,Barton G I. Evaluation and improvement of multiple sequence methods for protein secondary structure prediction[J]. Protein, 1999,34(4) : 509-- 519.

二级参考文献11

1孙伟,张大明,汪聪慧.海洛因来源鉴定的新方法[J].中国司法鉴定,2001(3):32-35. 被引量：5
2郑咏梅,张军,陈星旦,申铉国,张铁强.短波近红外光谱的整粒小麦蛋白质PLS方法的定量分析[J].光谱学与光谱分析,2004,24(9):1047-1049. 被引量：22
3赵丽娜,刘泽龙,田松柏.气相色谱-质谱方法快速测定馏分油累积收率和性质[J].分析化学,2005,33(1):90-92. 被引量：3
4陈宁.利用现代物证分析技术推断毒品的来源[J].政法学刊,2004,21(6):71-72. 被引量：5
5朱尔一.一种适合用于处理中药指纹图谱数据的偏最小二乘法[J].计算机与应用化学,2005,22(8):639-642. 被引量：12
6李剑,陈德钊,成忠,叶子青.构建支持向量机-偏最小二乘法为药物构效关系建模[J].分析化学,2006,34(2):263-266. 被引量：13
7Chong I G,Jun C H.Chemometrics and Intelligent Laboratory Systems,2005,78:103-112
8Lima S L T,Mello C,Poppi R J.Chemometrics and Intelligent Laboratory Systems,2005,76:73-78
9Gauchi J P,Chagnon P.Chemometrics and Intelligent Laboratory Systems,2001,58:171-193
10Narayanaswami K.Parameters for Determining the Origin of Illicit Heroin Samples.Bull Narc.1985,37(1):49-62

共引文献10

1黄星,马果花,张春水,白燕平.化学计量学在海洛因分类中的应用[J].计算机与应用化学,2008,25(4):437-440. 被引量：1
2徐琨,朱尔一,杨芃原,刘银坤.由质谱分析数据建立肝癌病人与健康人血清的分类模型[J].质谱学报,2008,29(5):268-273. 被引量：1
3徐琨,朱尔一,杨芃原,刘银坤.由质谱分析数据建立乙肝病人与健康人的分类模型[J].分析化学,2009,37(2):211-215. 被引量：2
4卓婧,王静,陈小霞,汤新华,邱彬,朱尔一,陈曦.食品中合成色素快速检测仪器的研制[J].分析化学,2011,39(2):283-287. 被引量：27
5李秋萍,卓婧,周淑晶.吸收光谱法同时检测食品中的苯甲酸钠与山梨酸钾[J].分析测试学报,2012,31(12):1556-1561. 被引量：11
6张戈力,毛安家,赵岩.一种PLS回归的并网风电项目利润预测方法[J].电力系统保护与控制,2013,41(8):87-92. 被引量：2
7于霜,程锦翔.生物发酵过程变量的NN-MIV软测量模型[J].控制工程,2015,22(2):312-316. 被引量：2
8陈波,颜治,赵旭,吴浩,王丙涛,靳保辉,赵琼晖,王宏菊,谢丽琪.元素含量分析应用于十种中国名茶的产地鉴别[J].湘潭大学自然科学学报,2016,38(1):61-67. 被引量：6
9刘艳.我国毒情监测现状及发展方向研究[J].云南警官学院学报,2020(4):19-24. 被引量：3
10陈波,靳保辉,颜治,涂小珂,王丙涛,赵琼晖,王宏菊,谢丽琪.有机成分与元素分析相结合鉴别6种中国名茶[J].食品科学,2014,35(18):119-123. 被引量：2

同被引文献13

1毕思文.数字人体力学模型[J].中国医学影像技术,2003,19(z1):41-45. 被引量：8
2毕思文.数字人体数学模型[J].中国医学影像技术,2003,19(z1):46-51. 被引量：6
3毕思文.数字人体信息模型[J].中国医学影像技术,2003,19(z1):52-56. 被引量：2
4毕思文.数字人体的数值模拟计算研究[J].中国医学影像技术,2003,19(z1):93-97. 被引量：3
5毕思文.数字人体简单巨系统的几种数学模型[J].中国医学影像技术,2003,19(11):1490-1493. 被引量：6
6韩继霞,毕思文.数字人体信息获取技术研究[J].世界科学技术-中医药现代化,2005,7(1):90-93. 被引量：4
7吴斐,毕思文.数字人体可视化技术的探讨[J].世界科学技术-中医药现代化,2005,7(1):94-97. 被引量：7
8钟世镇.数字人——信息与生命科学结合的新领域[J].科技导报,2005,23(2):9-12. 被引量：10
9毕思文.数字人体与医学[J].生物医学工程与临床,2005,9(3):179-184. 被引量：12
10北京大学生物信息中心.生物信息学在人类基因组计划中的应用.[2010-05-01] [EB/OL] http://www.cbi.pku.edu.cn/Chinese/documents/bioinfor/HGP/Bioinfor.html.

引证文献1

1侯鹏高.数字人体建模进展[J].齐齐哈尔医学院学报,2013,34(21):3221-3223. 被引量：1

二级引证文献1

1段师博.三维人体运动的计算机辅助分析在体育中的应用[J].电子测试,2014,25(10):149-150.

1王鹏良,江寿平,来鲁华,徐小杰,罗宇.蛋白质二级结构预测的综合分析[J].物理化学学报,1990,6(6):686-692. 被引量：1
2弓胜民,马洪洋,宛新华,赵永峰,何吉宇,周其凤.含氰基离子液体的合成、表征及流变性质研究[J].高等学校化学学报,2006,27(4):761-766. 被引量：4
3王化坤,钱伟懿.神经网络方法在蛋白质结构预测中的研究与应用[J].黑龙江科技信息,2008(4):23-23. 被引量：2
4朱尔一.一种适合用于处理中药指纹图谱数据的偏最小二乘法[J].计算机与应用化学,2005,22(8):639-642. 被引量：12
5王丙涛,陈波,涂小珂,颜治,靳保辉,林燕奎,谢丽琪.葡萄酒中元素分布与其原产地关系的分类模型[J].食品科学,2014,35(2):213-216. 被引量：14
6陈勇,黄钟奇,欧阳钢锋,曾兰珍,邹永匡.o-,m-,p-二甲苯或乙苯加丁酮体系的汽液平衡[J].中山大学学报（自然科学版）,1998,37(6):112-114. 被引量：3
7翟红林,金枚,王海军.o-,m-,p-二甲苯+丙烯腈体系的汽液平衡[J].兰州大学学报（自然科学版）,2000,36(6):71-74. 被引量：1
8曹绍峰.当互联网“遇见”教育[J].发明与创新（初中生）,2016(11):37-39.
9朱尔一,王小如.一种适用于处理中药指纹图谱数据的主成分正交分解算法[J].厦门大学学报（自然科学版）,2005,44(6):884-885. 被引量：3
10朱尔一,林燕.利用偏最小二乘法的一种变量筛选法[J].计算机与应用化学,2007,24(6):741-745. 被引量：8

厦门大学学报（自然科学版）

2009年第5期

浏览历史

内容加载中请稍等...

蛋白质中三联氨基酸数与二级结构数的模型研究被引量：1

参考文献6

二级参考文献11

共引文献10

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

蛋白质中三联氨基酸数与二级结构数的模型研究 被引量：1

参考文献6

二级参考文献11

共引文献10

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

蛋白质中三联氨基酸数与二级结构数的模型研究被引量：1