论文部分内容阅读
可变剪接(Alternative Splicing,AS)过程发生在前体信使RNA向成熟信使RNA的转换过程中,通过使一个基因产生多种mRNA成熟体,能够显著地增加转录组和蛋白质组多样性。目前,科研人员已经使用高通量测序技术揭晓了模式生物中AS的含量及其复杂性。但是目前我们对于多倍体植物甘蓝型油菜中的可变剪接现象还知之甚少。本研究中,我们从甘蓝型油菜14个不同发育阶段/组织中提取高质量的RNA后,将这些RNA等量混合,使用Pacbio RSII测序系统对混合RNA样本进行单分子实时(Single Molecule Real-Time,SMRT)测序和分析。来自混合样本的RNA被抽提后,构建不同长度的cDNA文库:1-2 kb、2-3 kb和3 kb以上,其中3 kb以上文库测2个SMRT cell,其余2个文库各测3个SMRT cell。另外,使用Illumina HiSeqTM 2000平台对甘蓝型油菜21个不同发育阶段/组织分别进行第二代测序(Next-generation sequencing,NGS),其中每个取样点2个生物学重复。我们结合SMRT测序和NGS测序,在全基因组范围内对甘蓝型油菜中的可变剪接现象进行了鉴定及分析。本研究中得到的主要结果如下:(1)利用SMRT测序技术,我们鉴定了 70,815个全长转录本,这些转录本覆盖了 20,898个注释编码基因。鉴定到1,360个新基因座和1,821个错误注释基因,进而更新了现有的甘蓝型油菜的基因注释。(2)同时,利用SMRT和NGS测序一共鉴定了 71,889个注释基因,其中有39,908个(55.51%)多外显子基因发生了 AS现象,这些基因一共发生了 80,598个AS事件。在可变剪接不同类型中,内含子保留类型(Intronretention,IR)发生频率最高,占41.06%以上,可变受体端位点类型(17.67%)频率约是可变供体端位点类型(10.97%)的1.6倍,外显子互斥事件(1.73%)占比最低。(3)对甘蓝型油菜不同组织/发育时期进行AS分析,发现AS事件在不同组织/发育时期之间呈现出动态变化现象。对于相同组织类型,早期发育阶段的AS事件基本上要多于晚期发育阶段。例如,在叶子组织中,幼叶中的AS事件共计47,017个,显著高于子叶(37,722个)中;而在花蕾、种子和角果皮组织中,随着成熟度的增加可变剪接事件总数表现出先增加后减少的趋势。这种不均等分布可能与不同组织中表达的基因总数有关,并且AS基因比率(AS基因数/总表达基因数)在更年幼的组织中更高。(4)不同的AS类型具有不同的特征,这些特征可能有差异的影响各个AS类型。其中,本研究结果表明在甘蓝型油菜中,外显子数目的增加可以促进IR的频率;内含子长度的增加,外显子跳跃(Exon Skipping,ES)的比例会增加,IR的比例减少。另外一方面,随着基因表达水平的增加,IR事件呈现出降低趋势,ES事件发生频率显著增加。通过对多倍体植物甘蓝型油菜进行可变剪接分析,我们鉴定了大量的可变剪接事件,并且通过SMRT测序得到的全长转录本序列更新了现有的甘蓝型油菜基因组注释,为不同异构体的后续功能研究提供丰富的数据资源,并且进一步增强了人们对多倍体植物中可变剪接的认识。