论文部分内容阅读
玉米(Zea mays)是世界上三大粮食和饲料作物之一。同时也是重要的食品、能源及轻纺工业原料。因此,玉米是关系到粮食安全和环境保护两方面的重要作物。随着人口增长、畜牧业的发展和可再生能源需求的增长,玉米的需求量逐年增加。但是由于耕地面积减少、气候变迁等制约因素,玉米的产量已不能满足需求。培育高产、高抗逆性的玉米品种可以促进玉米产量的提高,因此也是解决玉米供需不平衡的关键。生物信息和基因编辑已成为基因功能研究的重要技术手段,可为作物遗传育种的基础和应用研究提供理论依据和技术支撑。
细胞分裂素氧化酶/脱氢酶(cytokinin oxidase/dehydrogenase,CKX)通过降解细胞分裂素,调控植物体内细胞分裂素平衡,进而调控植物的生长发育,同时与植物的抗逆性和产量有密切的联系。CKX由一个多基因家族编码,在玉米基因组中含有13个CKX基因。迄今国内外关于玉米CKX基因家族的研究主要集中在ZmCKX1和ZmCKX10两个基因,而且缺乏ZmCKX基因在不同组织、发育阶段和胁迫条件下表达模式的全面分析。
本研究利用多种生物信息分析程序和软件,对B73基因组中的CKX基因进行系统的鉴定分析;同时利用GEO数据库中的相关数据,系统地整理归纳和分析了ZmCKX在不同组织,时间和条件下的表达模式。此外,对114个Cas9转基因玉米株系进行鉴定和筛选,获得单拷贝、高表达的转基因株系,供后续对玉米CKX基因和其他基因功能研究、性状改良或者育种应用。主要结果如下:
1.使用HMMER程序对玉米基因组的CKX基因家族成员进行鉴定,共发现13个ZmCKX基因;根据基因的ID和基因组、gff3注释信息和CDS信息,确定13个基因分布在7条染色体上,除ZmCKX11基因的长度为9212bp外,其余12个基因的长度在1.9kb~4.8kb之间。13个ZmCKX基因的CDS序列长度在1.5kb~1.7kb之间。
2.根据ZmCKX基因ID从玉米基因组蛋白质序列文件中提取氨基酸序列并进行统计分析,氨基酸的数量在494~582之间,相对分子质量在53.89~62.15kDa之间;利用ExPASy工具预测分析蛋白质的理化性质,确定ZmCKX大都为酸性蛋白,理论等电点在5.31~6.61之间,且都为亲水性蛋白,其中6个ZmCKX蛋白为稳定蛋白,其余7个为不稳定蛋白;利用Protcomp对ZmCKX的亚细胞定位进行预测结果表明,除了ZmCKX1和ZmCKX5在细胞外之外,其余都定位在液泡。利用MEME软件对ZmCKX蛋白序列中包含的保守结构域进行了分析,获知在进化树同一分支的ZmCKX蛋白序列包含的保守结构域的种类、数量、分布都比较相似,处于不同分支的蛋白序列则存在差异;对基因结构的分析与对保守结构域的分析有相似的结论。
3.为了解CKX基因在拟南芥、水稻、高粱和玉米之间的进化关系,利用ME GA-X软件,对上述物种包含的43个CKX基因进行进化分析发现,这些基因分布在6个亚组内,13个ZmCKX基因分布在5个亚组中。其中一个亚组包含5个ZmCKX基因,其余4个亚组包含1~3个ZmCKX基因。有4对ZmCKX基因(Zm CKX2/ZmCKX3,ZmCKX4/ZmCKX4b,ZmCKX7/ZmCKX8,ZmCKX11/ZmCKX12)具有较近的亲缘关系,后续分析证明这4对基因为串联重复基因,且他们之间的Ka/Ks值均小于1。利用JCVI程序对B73、Mo17两个玉米自交系和野生玉米大刍草(Teo)的CKX基因进行共线性分析表明,B73基因组与Teo基因组存在6对共线的CKX基因,而B73基因组与Mo17基因组存在8对共线的CKX基因,说明B73和Mo17基因组中的CKX基因的存在差异。
4.利用Plant CARE数据库对基因上游2000bp的启动子区域的顺式作用元件进行预测得知,ZmCKX基因上游主要包含有7中顺式作用元件:厌氧响应元件ARE,光响应元件G-box、GATT-motif、I-box,缺氧响应元件GC-motif、玉米蛋白代谢调控激活元件O2-site以及核心启动子原件TATA-box,并且基因之间存在数量和分布的差异。
5.通过对GEO数据库中现有的RNA-Seq测序数据进行挖掘和整理分析ZmCKX基因的表达模式,发现13个ZmCKX基因在不同组织、时间和条件下的表达模式存在明显的差异。在正常条件下,ZmCKX7、ZmCKX8只在雄穗中表达,具有组织特异性。ZmCKX9,ZmCKX11在所有组织中几乎不表达。ZmCKX2、ZmCKX4、ZmCKX6、ZmCKX10四个基因在多个组织中具有较高的表达量。在种子发育过程中,ZmCKX2~6和ZmCKX10这六个基因有较高的表达量。其中ZmCKX6和ZmCKX10基因只在种子发育的前期有较高的表达,ZmCKX5基因呈现前后期高表达,种子发育中期表达降低的模式;同时,ZmCKX基因在胚、胚乳中与整个种子中的表达模式不同,纵观胚、胚乳和种子中的表达模式,发现ZmCKX5和ZmCKX6基因,在种子发育的前期表达非常高,但在胚和胚乳发育的前期不发生表达,因此推测这两个基因基因在种子的其他部位有较高的表达。在不同胁迫条件下,ZmCKX基因表达模式变化不同。在干旱和淹没处理下,ZmCKX1基因在叶和胚珠中的表达上调,在干旱处理的根中下调;ZmCKX4和ZmCKX4b在干旱和淹没处理下的根、叶、种子、胚珠和雄穗中的表达都发生了上调;ZmCKX2基因在100nm NaCl处理下,主根中的表达上调,但在冠根中的表达下调。
6.对114个T1代Cas9转基因株系的Cas9基因分离比例进行鉴定分析,并利用卡方检验验证分离比例是否满足分离定律,筛选出14个满足3∶1分离比例的株系,推测为单拷贝的转基因株系,同时还有部分株系满足15∶1分离比例,推测为双拷贝的转基因株系。由于基因的插入位点对其表达可能产生影响,因此通过qPCR实验来检测单拷贝株系的Cas9基因表达的高低。通过对T2代转基因株系Cas9基因荧光定量PCR分析,最终确定9T011为单拷贝、高表达的Cas9转基因株系,以供后续的研究使用。
细胞分裂素氧化酶/脱氢酶(cytokinin oxidase/dehydrogenase,CKX)通过降解细胞分裂素,调控植物体内细胞分裂素平衡,进而调控植物的生长发育,同时与植物的抗逆性和产量有密切的联系。CKX由一个多基因家族编码,在玉米基因组中含有13个CKX基因。迄今国内外关于玉米CKX基因家族的研究主要集中在ZmCKX1和ZmCKX10两个基因,而且缺乏ZmCKX基因在不同组织、发育阶段和胁迫条件下表达模式的全面分析。
本研究利用多种生物信息分析程序和软件,对B73基因组中的CKX基因进行系统的鉴定分析;同时利用GEO数据库中的相关数据,系统地整理归纳和分析了ZmCKX在不同组织,时间和条件下的表达模式。此外,对114个Cas9转基因玉米株系进行鉴定和筛选,获得单拷贝、高表达的转基因株系,供后续对玉米CKX基因和其他基因功能研究、性状改良或者育种应用。主要结果如下:
1.使用HMMER程序对玉米基因组的CKX基因家族成员进行鉴定,共发现13个ZmCKX基因;根据基因的ID和基因组、gff3注释信息和CDS信息,确定13个基因分布在7条染色体上,除ZmCKX11基因的长度为9212bp外,其余12个基因的长度在1.9kb~4.8kb之间。13个ZmCKX基因的CDS序列长度在1.5kb~1.7kb之间。
2.根据ZmCKX基因ID从玉米基因组蛋白质序列文件中提取氨基酸序列并进行统计分析,氨基酸的数量在494~582之间,相对分子质量在53.89~62.15kDa之间;利用ExPASy工具预测分析蛋白质的理化性质,确定ZmCKX大都为酸性蛋白,理论等电点在5.31~6.61之间,且都为亲水性蛋白,其中6个ZmCKX蛋白为稳定蛋白,其余7个为不稳定蛋白;利用Protcomp对ZmCKX的亚细胞定位进行预测结果表明,除了ZmCKX1和ZmCKX5在细胞外之外,其余都定位在液泡。利用MEME软件对ZmCKX蛋白序列中包含的保守结构域进行了分析,获知在进化树同一分支的ZmCKX蛋白序列包含的保守结构域的种类、数量、分布都比较相似,处于不同分支的蛋白序列则存在差异;对基因结构的分析与对保守结构域的分析有相似的结论。
3.为了解CKX基因在拟南芥、水稻、高粱和玉米之间的进化关系,利用ME GA-X软件,对上述物种包含的43个CKX基因进行进化分析发现,这些基因分布在6个亚组内,13个ZmCKX基因分布在5个亚组中。其中一个亚组包含5个ZmCKX基因,其余4个亚组包含1~3个ZmCKX基因。有4对ZmCKX基因(Zm CKX2/ZmCKX3,ZmCKX4/ZmCKX4b,ZmCKX7/ZmCKX8,ZmCKX11/ZmCKX12)具有较近的亲缘关系,后续分析证明这4对基因为串联重复基因,且他们之间的Ka/Ks值均小于1。利用JCVI程序对B73、Mo17两个玉米自交系和野生玉米大刍草(Teo)的CKX基因进行共线性分析表明,B73基因组与Teo基因组存在6对共线的CKX基因,而B73基因组与Mo17基因组存在8对共线的CKX基因,说明B73和Mo17基因组中的CKX基因的存在差异。
4.利用Plant CARE数据库对基因上游2000bp的启动子区域的顺式作用元件进行预测得知,ZmCKX基因上游主要包含有7中顺式作用元件:厌氧响应元件ARE,光响应元件G-box、GATT-motif、I-box,缺氧响应元件GC-motif、玉米蛋白代谢调控激活元件O2-site以及核心启动子原件TATA-box,并且基因之间存在数量和分布的差异。
5.通过对GEO数据库中现有的RNA-Seq测序数据进行挖掘和整理分析ZmCKX基因的表达模式,发现13个ZmCKX基因在不同组织、时间和条件下的表达模式存在明显的差异。在正常条件下,ZmCKX7、ZmCKX8只在雄穗中表达,具有组织特异性。ZmCKX9,ZmCKX11在所有组织中几乎不表达。ZmCKX2、ZmCKX4、ZmCKX6、ZmCKX10四个基因在多个组织中具有较高的表达量。在种子发育过程中,ZmCKX2~6和ZmCKX10这六个基因有较高的表达量。其中ZmCKX6和ZmCKX10基因只在种子发育的前期有较高的表达,ZmCKX5基因呈现前后期高表达,种子发育中期表达降低的模式;同时,ZmCKX基因在胚、胚乳中与整个种子中的表达模式不同,纵观胚、胚乳和种子中的表达模式,发现ZmCKX5和ZmCKX6基因,在种子发育的前期表达非常高,但在胚和胚乳发育的前期不发生表达,因此推测这两个基因基因在种子的其他部位有较高的表达。在不同胁迫条件下,ZmCKX基因表达模式变化不同。在干旱和淹没处理下,ZmCKX1基因在叶和胚珠中的表达上调,在干旱处理的根中下调;ZmCKX4和ZmCKX4b在干旱和淹没处理下的根、叶、种子、胚珠和雄穗中的表达都发生了上调;ZmCKX2基因在100nm NaCl处理下,主根中的表达上调,但在冠根中的表达下调。
6.对114个T1代Cas9转基因株系的Cas9基因分离比例进行鉴定分析,并利用卡方检验验证分离比例是否满足分离定律,筛选出14个满足3∶1分离比例的株系,推测为单拷贝的转基因株系,同时还有部分株系满足15∶1分离比例,推测为双拷贝的转基因株系。由于基因的插入位点对其表达可能产生影响,因此通过qPCR实验来检测单拷贝株系的Cas9基因表达的高低。通过对T2代转基因株系Cas9基因荧光定量PCR分析,最终确定9T011为单拷贝、高表达的Cas9转基因株系,以供后续的研究使用。