论文部分内容阅读
研究目的:1.确定不同蓝藻基因组内的转录因子编码和基因家族分布情况;2.分析不同蓝藻基因组转录因子的差异和共性;3.建立数据库,把所有的蓝藻转录因子资源和数据高度整合和共享;4.分析蓝藻转录因子分子进化机制以及和环境适应性的关系.
方法:1.采用基于HMM profile、Blast和Helix-turn-helix SCaR三种完全不同的方法确定候选转录因子;2.采用Pfam数据库进行domain assignment排除假阳性和进行基因家族分类;3.采用C1ustalW进行多序列比对和MEGA3中的距离-邻接法和最大简约法进行进化树的构建.每个分支的可靠性通过1000次Bootstrap得到:4.采用Linux+Apache+Php+Mysql搭建cTFbase转录因子数据库,5.其他各种辅助功能和工具都采用Perl计算机语言和Bioperl模块完成.
结果:1.不同蓝藻物种编码的转录因子数目差异非常大,在所有分析的蓝藻物种当中,Nostoc punctiforme PCC73102含有最多的转录因子数目,达到了166个,而Prochlorococcus marinus str.MIT 9312编码了仅21个转录因子,为最少的一个物种;
2.在蓝藻中,我们一共发现了25个转录因子基因家族.其中,成员数目最多的是OmpR基因家族,含有150个成员.基因家族成员最少的是NifT,只有4个.
3.发现蓝藻的转录因子的DBD域一共只有9种,其中最多的是Winged helix DNA-binding motif,其他的有C-terminal effector domain of the bipartite, Homeodomain-like and lambda repressor-like DNA-binding domains等;
4.在蓝藻转录因子当中,我们发现其中616个只含有单种DBD域.在几个特殊的转录因子当中,单个转录因子含有多个DBD域.另外330个转录因子除了DBD域以外,还有其他的功能域.这些功能域暗示这些转录因子除了和启动子结合以外,还具有其他的作用;
5.结果建立了国际上第一个蓝藻的转录因子数据库cTFbase(http://cegwz.com/).在数据库交互式页面中,用户可以浏览,检索以及下载所有的蓝藻的转录因子信息,与此同时,用户还可将自己的序列进行blast比对,多序列比对,对选定的物种确定其orthologs关系,以及进行分子进化分析等等一系列功能;6.发现所有蓝藻都含有11个转录因子基因家族.其中三个基因家族(BolA,DUF387和DnaA)在不同的蓝藻物种当中的分布几乎完全是一致的,在剩下的8个转录因子基因家族,有6个内部能形成monophyletic clade.这些转录因子组成了蓝藻进化过程当中最小的核心转录因子.
结论:1.不同蓝藻物种编码的转录因子数目差异显著,不管是否把基因组的大小考虑进去,在淡水(或者岩石)中的蓝藻普遍比生活在海水中蓝藻还有更多的转录因子.这种现象应该是不同蓝藻对不同环境适应的一种表现;
2.尽管不同的转录因子具有很远的结构特征,但是还是存在着一定的共性,比如DBD域在转录因子中的相对位置在同一基因家族当中基本一致,转录因子的DBD域的种类可能非常的有限.这些特性可能会使今后在基因组范围内编译基因转录调控网络成为可能;
3.建立的国际上第一个蓝藻转录因子数据库(http//www.cegwz.com/),提供了一个集中研究蓝藻转录因子和蓝藻转录因子比较基因组学的平台,为研究和编译基因转录调控网络提供更多有用的信息;
4.不同蓝藻物种转录因子的差异除了表现在数目差异以外还表现在域的组成结构上,在淡水(或者岩石)中的蓝藻转录因子比生活在海水中蓝藻的转录因子还有更加复杂的结构域,这种现在应该是淡水(或者岩石)中的蓝藻为更好地适应多变的环境.
5.在不同蓝藻中确定的核心转录因子说明这些转录因子在蓝藻的进化当中起着基础和核心的作用.这些转录因子应该是很古老的基因家族,是在蓝藻分化以前就可能进化过来且没有经历水平基因转移和基因丢失.