论文部分内容阅读
在本篇论文中对八种常见人类传染病的十种病原体细菌的高表达基因进行了预测与分析,我们采用了两种基于密码子使用偏性的方法即密码子适用指数CAI和E(g)指数来预测这十种细菌中的高表达基因,经过翻译选择压力指数S的筛选,五个具有较大翻译选择压力的基因组被选择用来分析。五个选择的基因组中共有44个共同预测的高表达基因,包括36个核糖体蛋白基因、7个编码主要的转录/翻译因子基因以及分子伴侣蛋白DnaK。功能类分析表明预测的高表达基因大多数都属于蛋白质合成以及翻译后修饰、能量代谢等生物必须的基础代谢环节,致病性因子分析表明绝大多数致病性因子基因均为中等或者低等水平表达,只有少数基因被预测为高表达基因,且不同基因组中高表达致病性基因均不一致,说明五种致病菌的不同致病机理。 通过使用实验数据与CAI和E(g)理论预测值进行比较分析,我们发现CAI和E(g)预测高表达基因的理论值与实验数据的相关性没有显著差异,说明两种方法预测的结果的准确性等基本相同。而在另外一项研究中我们发现两种方法预测高表达基因的重合率与密码子使用偏性有着很好的正相关性,我们提出可以采用两种方法的重合率作为判断细菌基因组密码子使用偏性的重要指标,为高表达基因预测等工作提供依据。 在对33个具有两条染色体的细菌基因组的高表达基因研究工作中,我们发现除了争论贪噬菌外的其他基因组中,第一条染色体上高表达基因的数量、高表达基因所占基因总数的百分比以及两种方法预测的高表达基因的重合率均要高于第二条染色体,说明了第一条染色体对细菌而言具有更重要的作用。争论贪噬菌的特殊情况有待进一步的研究说明,我们为其提供了一个理论分析参考。