摘要
比较基因组分析表明植物比低等生物和动物含有更多的编码基因。研究人员猜测这主要由于植物基因组中编码转录因子等调控蛋白的基因数量多于动物导致的,意味着植物的转录调控机理可能更加复杂。本研究,针对拟南芥、大肠杆菌以及人类的全基因组启动子序列开展了DNA自由势能分布,弯折度,单核苷酸组成分布及碱基偏差等特征的计算分析比较,期望从启动子结构差异特征分析结果中找到支持上述假说的实验证据。研究结果表明:三个物种的启动子具有转录起始位点(TSS)附近热稳定性最差,弯折度强的共性特征。拟南芥和人类一样在TSS上游(-25bp)具有相似的能量降落峰,而大肠杆菌的最大降低峰出现位置与真核生物不同,约在-10 bp和-35 bp区域。研究还发现拟南芥启动子区域自由势能,可弯折度,核苷酸的分布趋势与人类和大肠杆菌相比具有显著的差异特征。拟南芥TSS上游和下游区域能量和弯折度的变化范围最大,并且具有独特的GC偏好分布特征。我们的研究结果从计算生物学角度上阐明启动子结构差异是导致物种间转录因子识别机制不同的重要原因之一,实验数据进一步支持植物启动子转录调控机制比动物更加复杂的研究推论。