DNA序列信息内容的普适关系被引量：2

Discussion on the Universality of Information Content in DNA Sequences

下载PDF

导出

摘要为描述基因组中k tuple(k字)频数分布的特征,定义了4种信息量,对若干典型基因组序列进行了统计分析,研究了信息量与字长k的普适关系,解释了普适性的根源在于DNA序列的近中性进化,指出真正的挑战在于对特异字的探索,对特异字在DNA RNA 蛋白质相互作用信息系统中的含义做了初步讨论。 To describe the character of the distribution of k-tuple frequency in genomes, four kinds of information quantity are defined.By the statistical analysis of DNA sequences of 16 typical genomes the universal relation between k-tuple information-entropy and word length k is deduced.It is suggested that the universality is related to the neutral mutation-random drift of molecular evolution.The conserved over- or under-represented oligo-nucleotide fragment is defined as a specific word.The implication of these specific words in the information network of DNA-, RNA- and protein-interaction is discussed briefly.

作者罗辽复

机构地区内蒙古大学理工学院

出处《合肥学院学报（自然科学版）》 2005年第1期1-6,31,共7页 Journal of Hefei University :Natural Sciences

关键词 k-tuple频数信息量普适关系特异字基因组序列 genome k-tuple frequency information-quantity universal relation specific word

分类号 Q615 [生物学—生物物理学] Q523 [生物学—生物化学]

引文网络
相关文献

参考文献10

1[1]Xie HM, Hao BL. Visualization of k-tuple distribution in procaryote complete genomes and their randomized counterparts [ J ].IEEE Proc comp sys Bioinf,2003:31 ～42.
2[2]Luo LF, Lee WJ, Jia LJ ,Ji FM, Tsai L. Statistical correlation of nucleotides in a DNA sequence[ J ]. Phys Rev E, 1998,58:861～ 871.
3[3]Luo LF. Theoretic-Physical Approach to Molecular Biology [ M ]. Shanghai: Shanghai Scientific & Technical Publishers,2004:104 ～ 123.
4[4]Dermitzakis E T, Reymond A, Scamuffa N, et al. Evolutionary discrimination of mammalian conserved non - genic sequences [J]. Science, 2003, 302:1033 ～ 1035.
5[5]Bejerano G, Pheasant M, Makunin I, et al. Ultraconserved elements in the human genome [ J ]. Science, 2004,304:1321 ～1325.
6[6]He L,Hamm G J. MicroRNAs:Small RNAs with a big role in gene regulation[J]. Nature Rev Genetics,2004(5) :522.
7[7]Denli A M,Hannon G J. RNAi:an ever-growing puzzle[J].Trends Biochem. Sci,2003,28(4) :196 ～201.
8[9]Roy Frieden B. Physics from Fisher Information A Unification [ M ]. London: Cambridge, 1998:1 ～ 50.
9[10]Hsieh LC, Luo LF,Ji FM,Lee HC. Minimal model for genome evolution and growth[J]. Phys Rev Lett,2003,90:018101 -1-4.
10[11]Eddy S R. Non-coding RNA genes and the modern RNA world[J]. Nature Reviews Genetics,2001 (2) :919 ～929.

同被引文献12

1刘军,许甫荣.基于相对熵原理构建生物进化系统树[J].北京大学学报（自然科学版）,2003,39(z1):76-81. 被引量：5
2贾晓超,李培芳,罗辽复.基因组中“k字”频数的分布[J].内蒙古大学学报（自然科学版）,2005,36(3):301-305. 被引量：3
3傅强,钱敏平,陈良标,朱玉贤.编码序列和非编码序列的3-tuple分布特征(英文)[J].Acta Genetica Sinica,2005,32(10):1018-1026. 被引量：2
4Bin Li,Yi-Bing Li,Hong-Bo He.LZ Complexity Distance of DNA Sequences and Its Application in Phylogenetic Tree Reconstruction[J].Genomics, Proteomics & Bioinformatics,2005,3(4):206-212. 被引量：4
5李菁,李逢博,王炜.蛋白质序列复杂性简化与非比对序列分析[J].生物化学与生物物理进展,2006,33(12):1215-1222. 被引量：4
6李斌,李义兵,何红波.符号序列间的LZ复杂性距离及其应用[J].小型微型计算机系统,2007,28(5):849-854. 被引量：1
7Gao L, Qi J. Whole genome molecular phylogeny of large dsDNA viruses using composition vector method [ J ]. BMC Evolutionary Biology, 2007, 7:41.
8Xie H, Hao B. Visualization of K - tuple distribution in prokaryote complete genomes and their randomized counterparts [ A ]. CSB2002 Proceedings (C). Los Alamitos, California: IEEE Computer Soci- ety, 2002. 31-42.
9Zhou F, Olman V, Xu Y. Barcodes for genomes and applications [J]. BMC Bioinformatics, 2008, 9:546.
10Qi J, Wang B, Hao BL. Whole proteome prokaryote phylogeny without sequence alignment: a K-string composition approach [ J 1 J Mol Evol, 2004, 58 ( 1 ) : 1-11.

引证文献2

1沈娟,吴文武,解小莉,郭满才,袁志发.基于DNA序列K-tuple分布的一种非序列比对分析[J].遗传,2010,32(6):606-612. 被引量：3
2刘红梅,刘国庆.基于k-mer组分信息的系统发生树构建方法[J].生物信息学,2013,11(2):100-104. 被引量：4

二级引证文献7

1周扬,屈武斌,卢一鸣,张成岗,杨毅.基于文本频谱的中文文本聚类方法[J].四川大学学报（自然科学版）,2012,49(6):1386-1394.
2张盈盈,李春,杨闫,贾美多.基于多重集逆序数的DNA序列的数值刻画及其应用[J].计算机与应用化学,2014,31(6):705-708. 被引量：2
3贾美多,杨闫,张盈盈,李春.蛋白质序列基于k-字的数值刻画及应用[J].浙江农业学报,2014,26(6):1635-1640. 被引量：2
4李春,刘欢,褚威威,费文超,韩苗苗.DNA序列非退化的二维图形表示及其应用[J].渤海大学学报（自然科学版）,2014,35(4):307-312. 被引量：1
5李曙光,陈姝颖,朱丽波.有根系统发生树的精确有效比较[J].计算机科学,2015,42(12):283-287.
6史晓楠,徐澜,徐丹丹,高慧慧.一种改进的基于Hash算法及概率的k-mer索引方法[J].通信电源技术,2017,34(3):70-72. 被引量：2
7张永芬,周勋,罗辽复,张利绒.鸟类基因组进化树的构建与分析[J].计算生物学,2017,7(1):1-11. 被引量：1

1沈娟,吴文武,解小莉,郭满才,袁志发.基于DNA序列K-tuple分布的一种非序列比对分析[J].遗传,2010,32(6):606-612. 被引量：3
2李培芳,贾晓超,李宏,罗辽复.基因组“k字”频数普适关系的研究[J].内蒙古大学学报（自然科学版）,2006,37(2):153-159.
3李华,应晓敏,查磊,李伍举.基于k-tuple组合的酵母ncRNA与mRNA的比较研究[J].生物物理学报,2006,22(2):110-116.
4长颈羚[J].小学时代,2017,0(4):39-40.
5傅强,钱敏平,陈良标,朱玉贤.编码序列和非编码序列的3-tuple分布特征(英文)[J].Acta Genetica Sinica,2005,32(10):1018-1026. 被引量：2
6赵楠,赵飞,李玉花.锌指蛋白结构及功能研究进展[J].生物技术通讯,2009,20(1):131-134. 被引量：55
7肖守中,龙银香,巨杉.暂时神经联系的计算机模拟:一个反映DNA-RNA-Pr系统作用的模型[J].生物医学工程学杂志,1996,13(2):136-140.
8洪洋,宋冰,王丕武,王贺.锌指蛋白结构及其功能研究[J].才智,2010,0(35):42-42. 被引量：1
9分子生物学[J].中国生物学文摘,2006,20(4):29-30.
10王远程,左晓峰,孙东旭,陈建新,管致和.家蝇幼虫抗菌物质组成及其理化性质[J].微生物学报,1997,37(2):148-153. 被引量：66

合肥学院学报（自然科学版）

2005年第1期

浏览历史

内容加载中请稍等...

DNA序列信息内容的普适关系被引量：2

参考文献10

同被引文献12

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

DNA序列信息内容的普适关系 被引量：2

参考文献10

同被引文献12

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

DNA序列信息内容的普适关系被引量：2