蛋白质编码区的Takagi-Sugeno模糊模型辨识被引量：1

Prediction of protein coding regions by Takagi-Sugeno model

下载PDF

导出

摘要 DNA序列编码区的辨识是基因辨识的一个重要方面。由于基因序列数据量大,导致许多统计辨识算法泛化性差、运算速度慢。根据编码区域序列和非编码区域序列相比有不同的碱基组成,提出将Takagi-Sugeno模型用于DNA序列的编码区辨识。首先,用基于模糊似然函数的模糊聚类算法确定系统的模糊划分数目,进而根据聚类个数建立相应的Takagi-Sugeno局部线性化模型,最后用最小二乘法实现模型结论参数的辨识。该算法不仅可以确定编码区的位置,还可以辨识出密码子第一位碱基的位置,对蛋白质结构的研究是非常重要的。算法简单、高效。仿真结果表明,该算法非常适合编码区辨识和其他编码区辨识算法有可比性。 An important step in gene identification is to predict coding regions in DNA sequence.Due to the large volume of gene data leading to the problem of poor generalization capability and lower computing speed in many algorithms of prediction of coding region.In this paper,a Takagi-Sugeno model of DNA sequence is built based on the different composition of nucleotides in coding regions and non-coding regions.First,the system is quickly divided into several fuzzy parts using clustering algorithm based on the fuzzy likelihood function.Then,regarding cluster number as a rule number,Takagi--Sugeno fuzzy model has been built.Finally,the consequent parameters of the model are identified associating with LS.The algorithm not only can predict coding regions,but also can identify the first nueleotide of the codon in coding regions.This is very significant for accurate translatiorl into a protein sequence.The algorithm is simple and simulation results show the proposed method is more effective for coding regions prediction than the existing coding region discovery tools.

作者郭烁朱义胜

机构地区大连海事大学信息工程学院沈阳化工学院信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2009年第26期216-219,共4页 Computer Engineering and Applications

基金国家自然科学基金No.60671061 助教校中青年科研启动基金资助项目(沈阳化工学院)No.2 00424~~

关键词 DNA序列编码区密码子 TAKAGI-SUGENO模糊模型模糊聚类最小二乘法 coding region in DNA sequence codon Takagi-Sugeno model clustering algorithm Least Square（LS）

分类号 TN911.72 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献13

1Hatzigeorgiou A, Mache N, Reczko M.Functional site prediction on the DNA sequence by artificial neural networks[C]//Proceedings of the 1996 IEEE International Joint Symposia on Intelligence and Systems, 1996,7(96) : 12-16.
2Cai Y D,Bork P.Homology-based gene prediction using neural nets[J].Analytical Biochemistry, 1998,265(2):269-274.
3Emmersen J,Rudd S.Separation of sequences from host-pathogen interface using triplet nucleotide frequencies[J].Fungal Genetics and Biology, 2007,44(27) :231-241.
4Brejova B,Brown D G,Vinar T.The most probable annotation problem in HMMs and its application to bioinformatics[J].Journal of Computer and System Sciences,2007,73(7):1060-1077.
5Yin M M,Wang J T L.GeneScout:A data mining system for predicting vertebrate genes in genomic DNA sequences[J].Infornaation Sciences, 2004,163 ( 1/3 ):201-218.
6Vaidyanathan P P,Yoon B J.Digital filters for gene prediction applications[C]//IEEE Asilomar Conference on Signal,Systems and Computers.Monterey,CA:IEEE Signal Processing Society,2002:306-310.
7田元新,陈超,邹小勇,邱建丁,蔡沛祥,莫金垣.外显子周期三行为特征的研究[J].化学学报,2005,63(13):1215-1219. 被引量：16
8Takagi T,Sugeno M.Fuzzy identification of systems and its application to modeling and control[J].IEEE Trans on Systems,Manand Cybernetics, 1985,15( 1 ) : 116-132.
9曾凡锋,蔡自兴,马润津.基于模糊似然函数的模糊辨识方法[J].控制与决策,1998,13(5):581-584. 被引量：16
10郭烁,李平.模糊聚类与最小二乘相结合建立非线性系统模型[J].模式识别与人工智能,2003,16(3):288-291. 被引量：7

二级参考文献31

1睢刚,陈来九.动态系统模糊模型辨识及其自学习算法[J].自动化学报,1995,21(6):749-753. 被引量：5
2尚修刚,蒋慰孙.一种新的模糊似然函数[J].模式识别与人工智能,1997,10(1):9-14. 被引量：8
3廖俊,朱世强,林建亚,任德祥.遗传算法在T-S模糊模型辨识中的应用[J].信息与控制,1997,26(2):140-145. 被引量：11
4Takagi T, Sugeno M. Fuzzy Identification of Systems and Its Application to Modeling and Control. IEEE Trans on Systems, Man and Cybernetics, 1985, 15(1): 116- 132.
5Chen Weixu, Yong Zailu. Fuzzy Model Identification and Self-learning for Dynamic Systems. IEEE Trans on System, Man and Cybernetics, 1987, 17(4): 683-689.
6Liang Wang. Complex Systems Modeling via Fuzzy Logic. IEEE Trans on System, Man and Cybernetics, 1996, 26(1) : 100 - 106.
7张化光，复杂系统的模糊辨识与模糊自适应控制，1993年
8Sugeno M，Fuzzy Sets Syst，1988年，28卷，1期，15页
9吴乃虎.基因工程原理(上册):第2版[M].北京:科学出版社,2002.10-12.
10Tiwari, S.; Ramachandran, S.; Bhattacharya, A.; Bhatta-charya, S.; Ramaswamy, R. CABIOS, Comput. Appl. Biosci.1997, 13(3), 263.

共引文献48

1郭烁,李平,魏立峰.模糊聚类在非线性系统广义预测中的应用[J].仪器仪表学报,2006,27(z3):2335-2337.
2栾薇.内含子及其在基因表达中的作用[J].云南农业科技,2008(S3):182-186. 被引量：5
3江善和,李强.基于模糊分类的模糊神经网络辨识方法及应用[J].控制工程,2005,12(3):266-269. 被引量：9
4江善和,李强.一种基于模糊分类的模糊神经网络辨识方法[J].计算技术与自动化,2005,24(2):27-30.
5张雪莲,潘铁强,唐可洪,马晓丽.柔性机械臂T-S模糊模型的辨识及其分析[J].机电工程,2006,23(11):36-38. 被引量：2
6王卓,苑明哲,王宏,王天然.水泥熟料质量指标的软测量建模研究[J].化工自动化及仪表,2006,33(6):53-54. 被引量：10
7张雪莲,潘铁强,唐可洪,马晓丽.软腔体柔性机械臂的T-S模糊建模方法的研究[J].计算机测量与控制,2007,15(5):662-664.
8张雪莲,潘铁强,唐可洪,马晓丽.软腔体柔性机械臂的T-S模糊建模与控制[J].仪器仪表学报,2007,28(6):1093-1098. 被引量：1
9康缘,李京华.基于时频分析的战场声信号主成分特征提取技术[J].电子测量技术,2007,30(5):4-7. 被引量：1
10李纯静,沈保锁.ITU-T G.723.1语音编码算法分析及优化策略[J].电子测量技术,2007,30(9):104-106. 被引量：1

同被引文献19

1贺文强,苗果园,张永清,高志强.山西省小麦品质区划研究[J].山西师范大学学报（自然科学版）,2006,20(2):82-84. 被引量：9
2潘洁,戴廷波,姜东,朱艳,曹卫星.基于气候因子效应的冬小麦籽粒蛋白质含量预测模型[J].中国农业科学,2005,38(4):684-691. 被引量：16
3王绍中,李春喜,章练红,崔转玲.小麦品质生态及品质区划研究 Ⅰ.河南省小麦品质现状及地区差异[J].河南农业科学,1995,24(10):3-10. 被引量：37
4Han Jiawei,Kamber M.Data mining concepts and techniques[M].范明,孟小峰,译.2版.北京:机械工业出版社,2007.
5Makrehchi M, Kamel M S.Text classification using small num- ber of features[C]//Pemer P, Imiya A.Proc of the 4th Int'l Conf on Machine Learning and Data Mining in Pattern Recognition,2005:580-589.
6Daniel C, Triboy E.Changes in wheat protein aggregation during grain development: effects of temperatures and water stress[J].Eu- ropean Journal of Agronomy,2002,16:1-12.
7Bradley P S, Fayyad U M.Refining initial points for k-means clustering[C]//Proc of the 15th Intemet Conf on Machine Learn- ing.San Francisco: Morgan Kaufmann Publishers, 1998: 91-99.
8中华人民共和国国家标准.GB/T17892-1999优质小麦强筋小麦[S].北京:国家质量技术监督局,1999.
9中华人民共和国国家标准.GB/T17893-1999优质小麦弱筋小麦[S].北京:国家质量技术监督局,1999.
10王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61

引证文献1

1黄芬,朱艳,梁敬东,伍艳莲,姜海燕.优化初始中心点的小麦品质区域聚类[J].计算机工程与应用,2011,47(36):34-37. 被引量：1

二级引证文献1

1文静,曹妍,张琳,牟向伟.基于双重遗传的聚类分析算法研究[J].计算机工程与科学,2017,39(12):2320-2325. 被引量：8

1梁霄波.数据挖掘算法性能优化的研究与应用[J].无线互联科技,2016,13(14):145-146.
2刘平,马玉韬,孙学宏,张成,杜勇.基因预测算法中阈值的傅里叶质谱分析[J].湖北农业科学,2014,53(6):1432-1435.
3马宝山,朱义胜.用于基因预测的自适应滤波器的仿真研究[J].系统仿真学报,2007,19(24):5620-5623. 被引量：4
4MALAYA KUMAR HOTA,VINAY KUMAR SRIVASTAVA.MULTISTAGE FILTERS FOR IDENTIFICATION OF EUKARYOTIC PROTEIN CODING REGIONS[J].International Journal of Biomathematics,2012,5(2):43-60. 被引量：1
5张剑,周兴建,卢建川.基于Takagi-Sugeno-Kang模糊集合的噪声干扰检测方法[J].电讯技术,2016,56(2):151-155. 被引量：4
6康荣雷,熊杰.GNSS载波相位相对定位的线性化模型误差分析[J].青岛大学学报（工程技术版）,2017,32(1):112-116.
7Lei Zhang,Fengchun Tian,Shiyuan Wang.A Modified Statistically Optimal Null Filter Method for Recognizing Protein-coding Regions[J].Genomics, Proteomics & Bioinformatics,2012,10(3):166-173. 被引量：1
8马玉韬,车进,关欣,滕建辅.加窗窄通带滤波器蛋白质编码区预测算法[J].数据采集与处理,2013,28(2):129-135. 被引量：5
9郭喜峰,王大志,刘炜.采用压缩感知采样的Takagi-Sugeno-Kang(TSK)功率模型(英文)[J].Chinese Journal of Chemical Engineering,2012,20(6):1161-1166.
10为什么放在口袋里的耳机线很容易缠在一起？[J].消费,2009(33):36-36.

计算机工程与应用

2009年第26期

浏览历史

内容加载中请稍等...

蛋白质编码区的Takagi-Sugeno模糊模型辨识被引量：1

参考文献13

二级参考文献31

共引文献48

同被引文献19

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

蛋白质编码区的Takagi-Sugeno模糊模型辨识 被引量：1

参考文献13

二级参考文献31

共引文献48

同被引文献19

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

蛋白质编码区的Takagi-Sugeno模糊模型辨识被引量：1