摘要
生物序列(如DNA、RNA与蛋白质一级结构序列等)都是由一系列小分子团(如核苷酸、氨基酸等)排列组成,如把这些小分子团作为符号单元,那么这些生物序列就是生物序列就是生物学的语言文字,对这些语言文字的结构分析为生物序列的语义分析。生物序列语义分析的内容包括词法与语法的分析,它们是在分子水平基础上的生物语言分析,有关的变化规则我们称之为生物序列中的第二密码规则。本文以Swiss-Prot数据库为基础,利用频率统计、组合分析与信息的度量关系等数学工具,分析蛋白质一级结构序列中的词法规则,给出了关于蛋白质一级结构序列的几种稳定性的度量指标及其相应的稳定性理论,并探讨了它们在蛋白质演变与蛋白质工程中可能产生的应用。
Biological sequences (DNA, RNA or Protein sequences) are structed by a sequence of small molecules(ribotide or amino scid), they are spoken and written language of biolgy on the basis of moleculer biology. These semantic rules are said to be second cipher rules of biology. In this paper, we using the information and statstics analysis theory etc. mathematics instrument on the basis of Swiss-Prot databas, given some morphology rules of primary structure sequence of proteins, and obtain some stability measurement and principle of peptide bondd. We consider probable applications in protein engineering for these cipher rules.
出处
《工程数学学报》
CSCD
北大核心
2004年第5期665-674,679,共11页
Chinese Journal of Engineering Mathematics
基金
国家自然科学基金(10271061
90208022)
天津大学
南开大学联合研究项目
刘徽应用数学研究中心资助.
关键词
生物序列结构的语义分析
第二密码规则
蛋白质~级序列结构数据库的信息、统计分析
稳定性度量与原理
semantics analysis of biological sequences
second cipher rules
information and statistics analysis of primary structure database of proteins
stability measurement and principle