期刊文献+

蛋白质序列中可能存在的Zipf定律 被引量:1

Zipf's Law Probably Existing in Protein Sequences
下载PDF
导出
摘要 为了分析蛋白质序列中是否存在语言学中的Zipf定律,从蛋白质二级结构数据库DSSP中抽取1.7357万条序列,把具有相同二级结构标记的氨基酸残基连续片段定义为单词,结果表明:单词出现的频率分布近似服从指数为0.981的Zipf定律. In order to analyze whether Zipf' s law in linguistics exists in protein sequences, this paper uses 1. 735 7 × 10^4 protein sequences labeled with secondary structures which are selected from the DSSP database. The segments of successive amino acid residues with a same code of secondary structure are defined as words. The results show that the distribution of word emerging frequency follows Zipf' s law with the exponent as 0.981.
出处 《北京工业大学学报》 CAS CSCD 北大核心 2005年第4期366-368,共3页 Journal of Beijing University of Technology
基金 北京市自然科学基金资助项目(4052005)北京市教育委员会科技发展基金资助项目(km200310005013).
关键词 蛋白质序列 单词 Zipf定律 protein sequence word Zipf's law
  • 相关文献

参考文献7

  • 1关毅,王晓龙,张凯.现代汉语计算语言模型中语言单位的频度—频级关系[J].中文信息学报,1999,13(2):8-15. 被引量:15
  • 2ZIPF G K. Human Behavior and the Principle of Least Effort[M]. Cambridge, MA: Addison-Wesley, 1949.
  • 3MANDELBROT B. An Informational Theory of the Statistical Structure of Languages, in Communication Theory[M]. London: Betterworths, 1953. 486-502.
  • 4游荣彦.Zipf定律与汉字字频分布[J].中文信息学报,2000,14(3):60-65. 被引量:19
  • 5BURGOS J D, MORENO-TOVAR P. Zipf-scaling behavior in the immune system[J]. Biosystems, 1996, 39(3): 227-232.
  • 6AXTELL R L. Zipf distribution of U.S. firm sizes[J]. Science, 2001, 293: 1818-1820.
  • 7DURBIN R, EDDY S, KROGH A, et al. Biological Sequence Analysis[M]. Cambridge: Cambridge University Press, 1998.

二级参考文献4

共引文献30

同被引文献32

引证文献1

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部