论文部分内容阅读
DNA甲基化修饰是生物体内一种主要的表观遗传修饰,在机体正常发育、X染色体失活、基因组印记和转录抑制等各种生物过程中发挥着重要作用。已有数据表明大多数DNA甲基化主要发生在CG二核苷酸位点的胞嘧啶(mCG),且人类基因组中约70%的CG位点都具有甲基化修饰。然而,胞嘧啶甲基化也存在于CH(H=A,T或C)位点,约占胚胎干细胞和神经元中总胞嘧啶甲基化的25%。与mCG作用类似,mCH几乎发生在所有人体组织中,并且参与胚胎干细胞及神经元的转录抑制和印迹、成体干细胞分化期间发育相关基因的抑制。早在90年代初,CG甲基化修饰(mCG)被证实主要通过与含有MBD(Methyl-CpG-binding domain,甲基化CG结合蛋白结构域)结构域的蛋白质家族结合实现其转录抑制作用。MBD结构域是一个含有约70个氨基酸残基的结构域。目前,已经鉴定到11个人类MBD蛋白,包括MeCP2(methyl-CpG-binding protein 2,甲基化 CpG 结合蛋白 2)、M3D1-6、SETDB1/2(Histone-lysine N-methyltransferase SETDB1/2,组蛋白-赖氨酸 N-末端甲基转移酶)和BAZ2A/2B(Bromodomain adjacent to zinc finger domain protein 2A/B,与锌指结构域蛋白相邻的溴区结构域)。除识别甲基化mCGDNA,MeCP2蛋白也可以识别甲基化修饰的mCHDNA,以及非甲基化MARs(matrix attachment regions,核基质结合区)DNA。因此,本论文通过氨基酸序列比对、等温滴定量热法(ITC)结合实验、点突变实验及X衍射晶体结构分析等方法系统分析了 MeCP2和MBD1-4蛋白MBD结构域识别不同修饰DNA的特异性及结合方式。我们采用ITC方法系统比较了人源MeCP2和MBD1-4的MBD结构域重组蛋白识别mCG(不同长度和序列)、甲基化和非甲基化CH(H=A,C或T)DNA的亲和力。ITC数据显示MeCP2和MBD1-4 MBD结构域主要识别mCG序列,且对mCG周围序列没有识别选择性。为了证实这一结论,我们分别解析了 MBD2 MBD结构域识别两种不同mCG(mCGG和mCGT)DNA的复合物晶体结构。此外,我们发现MBD结构域也可以识别mCA或者CADNA,与其他mCH DNA只有较弱结合;MBD结构域识别不同序列DNA的结合能力表现为mCG>mCAC>mCAH~CAC>CAH。为进一步阐明MBD结构域识别mCA或者CAC DNA的分子机理,我们解析了 MBD2-mCAT、MBD2-mCAC/GTG、MBD2-CAC/GTG 和 MeCP2-mCAC/GTG 复合物晶体结构。我们发现MBD结构域特异识别mCAC和CAC DNA的互补序列GTG三核苷酸,表明甲基化修饰胞嘧啶对于MBD结构域识别mCH DNA不是必须的。虽然MeCP2最早被鉴定为识别mCG DNA的结合蛋白,且MeCP2识别甲基化修饰DNA多参与基因抑制,但早在1991年MeCP2的鸡同源物ARBP(Attachment Region Binding Protein,附着区结合蛋白)被发现识别非甲基化修饰的MARs序列DNA,且主要识别MARs的5’-GGTGT-3’中心序列基序位点。MARs DNA被报道可以调控基因表达,主要表现为促进邻近基因表达。因此结合以前的研究报道,我们推测MeCP2识别MARs DNA可能是一种促进基因表达的潜在途径。为此,我们利用ITC实验首先确认了 MeCP2可以识别MARs DNA,且识别能力主要依赖于5’-GTG-3’中心基序。随后解析了 MeCP2识别CAC/GTG的晶体结构。比对MBD2-CAC/GTG 和 MeCP2-CAC/GTG 晶体结构发现,MBD2-CAC/GTG 结构中 MBD2 蛋白的第二个精氨酸残基R188(对应于MeCP2中的R133)只与GTG基序的第一个鸟嘌呤碱基以及前一个腺嘌呤结合,而MeCP2-CAC/GTG的R133残基识别GTG三核苷酸中的TG二核苷酸,因此结构解释了为什么MeCP2识别GTG DNA的亲和力与mCG DNA相当,而此结合强于MBD2识别GTG DNA的能力。比较MeCP2-mCAC/GTG和MeCP2-CAC/GTG结构我们发现DNA的5胞嘧啶甲基指向R133主链的羰氧基,形成了距离约为3.4 A的弱氢键。我们认为这可能是MeCP2识别mCAC/GTG强于CAC/GTG DNA的主要原因。除MBD3外,MeCP2和MBD1/2/4的MBD结构域识别mCG DNA的分子机理都已经清楚。MBD3曾被报道是MBD家族中唯一不结合甲基化DNA的蛋白,但近来人们发现MBD3也能识别mCG DNA。我们的ITC实验证实MBD3的确可以识别mCG DNA。我们通过结构解析、ITC结合测定和定点突变实验进一步阐明了 MBD3的MBD结构域识别mCG DNA的结构基础。我们发现MBD3 MBD结构域通过保守的精氨酸残基结合mCG DNA,并且该识别没有序列方向选择性。此外,我们发现与其他mCG结合MBD结构域相比,MBD3第34位的苯丙氨酸是导致MBD3识别mCG DNA结合能力较弱的原因。通过上述研究,我们对MeCP2和MBD1-4 MBD结构域识别不同DNA的特异性进行了系统研究,拓宽了我们对MBD蛋白是一种mCG识别蛋白的传统认识,重新构建了我们对MBD蛋白的识别底物及调控机理的认识。