论文部分内容阅读
植物基因组中大部分基因以基因家族的形式存在,这些基因家族的起源、演化、以及功能的分化一直是进化生物学所关注的核心问题。在本论文中,我们以林木模式植物杨树(毛果杨,Populus trichocarpa)和裸子植物油松(Pinustabuliformis)为材料,在基因组和蛋白质功能层次上研究大型GST基因家族的起源、进化、以及功能分化的模式和分子机制,获得如下结果:
1、从杨树全基因组和松树基因组中分别鉴定和克隆到81个和44个GST基因,分为8个亚族,分别是Tau、Phi、Lambda、DHAR、EF1Bγ、Zeta、Theta和TCHQD。其中Tau是最大的亚家族,在杨树和松树中分别具有58个和26个成员。杨树Tau类GSTs主要通过串联重复的方式进行扩张,导致其大部分成员以基因簇的形式存在于染色体上。在杨树和拟南芥最近的共同祖先分化后,杨树Tau类GSTs发生了快速扩张,至少获得了51个新的Tau GSTs基因。杨树Tau和Phi类GSTs的扩张主要是通过串联重复实现,而其他小类群GSTs的扩张主要是通过全基因组加倍实现。相比较而言,串联重复对整个基因家族的扩张起最重要的作用。
2、在全基因组水平上对陆生植物和绿藻GST基因家族的进化分析发现,Tau类GST基因可能起源于维管植物,而Phi类GST基因可能起源于最早的陆地植物。在维管植物祖先中,Tau类GST可能有3个拷贝,Phi类GST可能有1个拷贝。而在种子植物祖先中,一个拷贝可能发生了重复事件而导致种子植物的祖先有4个Tau类GSTs,同样,种子植物祖先中有一个Phi类GST发生重复而导致具有3个GSTs拷贝。
3、GST蛋白包含N末端和C末端两个独立的结构域,杨树和松树Tau类GSTs的两个结构域都受负选择压力约束,但与N末端结构域相比,C末端结构域受到的选择约束更松弛,杨树和松树Tau类GSTs的两个结构域的进化模式相似。虽然杨树和松树Tau类GSTs基因都受负选择压力约束,但PAML分析发现某些氨基酸位点受到正选择,预示着杨树和松树Tau类GSTs基因可能存在功能的分化。
4、对杨树和松树Tau类GSTs蛋白的三维结构模拟发现,其GST蛋白的三维结构比较保守,仅在部分Loop区域具有细微的结构变异;N末端结构域是所有GST的共同底物GSH的结合区域,与C末端结构域相比,杨树和松树Tau GSTs的N末端结构域的三维结构高度保守,预示着对底物GSH的亲和力可能相似。
5、基因表达模式分析发现,杨树和松树Tau类GST基因的表达模式发生了显著分化,而其他7个小类型GST基因的表达模式比较保守,预示着Tau类GST基因的功能可能有显著的分化。对杨树7个串联排列的Tau和Phi类GST基因簇分析发现,每个簇内成员间的表达模式都存在显著的差异。
6、分析了44个(30个Tau,7个Phi,3个DHAR,2个Lambda,1个Theta和1个EF1Bγ类GSTs)代表不同进化关系和历史的杨树GSTs蛋白的底物特异性和催化活性,发现不同GST亚家族底物谱有很大差异,预示着发生了新功能化;对30个Tau类GSTs蛋白的功能数据分析发现,分布在同一基因簇内的成员具有不同的底物特异性,且对于同一底物的酶学活性也具有显著差异。对最近产生的重复基因对分析发现,有3种酶学活性和底物谱的分化模式:一种是两个重复基因表现出相同的底物谱,但是对于每种底物的酶学活性有变化;另一种是两个重复基因的底物谱有部分重叠,表明部分的亚功能化已经发生;第三种模式是两个拷贝具有不重叠的底物谱,预示着彻底的功能分化。
7、对29个杨树GSTs(20个Tau,6个Phi和3个DHAR类GSTs)的酶动力学研究发现,所有GSTs对GSH都展示出相似的高亲和力(KmGSH值在0.1-0.8mM),然而,对GSH的催化效率(kcat/Km)却存在显著差异。Tau和Phi类GSTs对疏水底物的亲和力(KmCDNB)和催化效率(kcat/Km)两者都有较大的差异。即使在串联重复的GST基因簇内,不同成员对底物的亲和力和催化效率也有明显差异,预示杨树GSTs对疏水底物结合能力的催化性质发生了分化。
综合系统发育关系、基因表达模式、酶底物特异性、酶动力学和蛋白质三维结构数据,本论文系统性地阐述了杨树和松树GST基因家族在不同层次上的功能分化模式及分化机制,揭示了不同层次上的亚功能化(新功能化)是重复基因被保留的主要机制,进而导致大基因家族的形成。