论文部分内容阅读
重复序列在小麦族物种基因组中占很高的比例,在普通小麦中国春基因组中含量高达85%以上,但基因组中重复序列的结构与功能研究较为薄弱。重复序列可分为串联重复(Tandem repeats,TR)和散在重复(Interspersed repeats,IR),仅少数TR在分子标记、进化研究和细胞遗传学分析中得到应用。近年来,随着基因组测序与组装技术的提升以及成本的下降,小麦族中多个物种的基因组序列的完成,为从全基因组水平上分析小麦及其近缘物种的TR的结构与功能,以及大规模开发TR探针应用于染色体精细鉴定等提供了基础。本研究基于小麦及其近缘物种的参考基因组,结合基因组学和分子细胞遗传学手段,明确了基因组中的TR分布特征,发掘了一批新的寡核苷酸(Oligo)探针,能够在小麦染色体上产生清晰稳定的荧光原位杂交(Florescent in situ hybridization,FISH)杂交信号,并利用新探针对小麦易位染色体片段进行了精细鉴定。研究结果如下:1、基因组TR分布可视化网络服务工具的建立。针对串联重复序列家族在基因组中的物理特征,基于BLAST,我们构建了TR富集与物理分布网络服务B2DSC(http://mcgb.uestc.edu.cn/b2dsc)。B2DSC作为TR分布可视化工具,实现了基于TR设计FISH寡核苷酸探针的预评估,并对FISH杂交信号进行物理定位。同时基于FISH杂交结果,评估参考基因组局部区段重复序列的拼装质量,为细胞遗传学分析改进复杂基因组质量提供指导。2、小麦及近缘物种参考基因组的TR发掘。建立了包括小麦(AABBDD)、乌拉尔图小麦(AA)、节节麦(DD)、野生二粒小麦(AABB)和栽培大麦(HH)物种的非冗余TR(non-redundant TR,NR-TR)全基因组分布数据库(http://mcgb.uestc.edu.cn/tr)。发现小麦各染色体TR含量在2-5%之间,在A、B和D组染色体上非均匀分布,以D组染色体的TR密度最高。明确了小麦基因组中不同长度TR阵列在基因组的分布与富集特征,说明重复序列结构多样性对小麦基因组进化发挥了重要作用。3、小麦基因组TR与基因表达调控分析。发现1-10 bp TR和31-60 bp TR分别在高置信度(high confidence,HC)基因的转录起始位点(transcription start site,TSS)上下游50 bp和基因转录终止位点(transcription terminal site,TTS)下游500bp内相对较高富集。在TSS上游1 Kb内和TTS下游300 bp内出现50拷贝以上TR阵列的HC基因,常常表现为完全不表达或有中低表达。类萌发素蛋白基因家族分析,发现编码区插入了TR的基因完全不表达。对93个低拷贝TR阵列的基因分析,表现了潜在的pre-miRNA序列的存在,为开展TR对全基因组的表达调控网络研究奠定了基础。4、基于高拷贝TR的寡核苷酸原位杂交探针的发掘。在TR全基因组分析的基础上,开展TR阵列的聚类分析,从46类小麦高拷贝TR以及3类大麦TR中获得了16个新寡核苷酸探针。验证发现它们在小麦染色体上有比较清晰稳定的非变性荧光原位杂交(nondenaturing FISH,ND-FISH)杂交信号,且结合B2DSC进行的基因组物理定位,构建了一张TR探针的染色体物理定位整合图谱,大大提高了FISH鉴定小麦及其近缘属物种染色体特定区段的分辨率。5、小麦高富集的小卫星(minisatellite)序列的分布与进化研究。小麦基因组中一类44 bp的TR序列Ta-3A1,共有69,135个拷贝,总长约3.02 Mb,为拷贝数最高的小卫星序列。Ta-3A1主要富集于小麦3AL、5AL、7AS、7AL、5BL和5DS很短的区间内。序列的聚类分析与物理分布分析,结合小麦族代表性物种染色体的比较ND-FISH分析,发现Ta-3A1拷贝数和染色体位置的快速变化,与小麦族物种形成和多倍体化过程中的染色体重排事件有关。6、基于TR的寡核苷酸探针用于染色体结构变异精准鉴定。利用发掘的Oligo探针,对小麦-偃麦草导入系Z4、小麦-黑麦-偃麦草易位系品种Amigo以及“川麦62”的染色体进行了多重探针的FISH分析。准确鉴定了Z4的易位染色体(Tr-I)的易位断点,其中3A的断点确定在位于长臂的532.13 Mb区域,3DS的47 Mb区段插入到Tr-I的端部。FISH鉴定发现小麦品种Amigo具有小麦-黑麦1RS.1AL易位染色体,小麦7BS.7AS和7BL.7AL易位,还确定了Amigo的1B染色体随体区域,长穗偃麦草染色体片段约为120 Mb。利用多种TR-Oligo探针,将“川麦62”中5B-7B相互易位染色体的断点分别定位于5B的99-151 Mb和7B的310-379 Mb之间。证实多探针ND-FISH可大幅度提高小麦及近缘物种染色体区段重排的鉴定分辨率,实现小麦外源新种质的高效鉴定。综上,本研究围绕小麦及其近缘物种中的串联重复序列,开展生物信息学分析,开发了可展示全基因组TR染色体分布的在线网络服务,已成为物种基因组TR分析的共享平台。开发的新型基于TR的寡核苷酸探针,并构建染色体物理定位整合图谱,成功用于小麦外源染色体易位区段的精准鉴定,实现了分子细胞遗传学研究与基因组学新进展的紧密结合,研究结果对完善小麦基因组结构、功能与进化的理论和指导小麦分子染色体工程育种的实践都具有重要意义。