小麦及其近缘物种串联重复序列的全基因组发掘与染色体区段鉴定

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:cocoxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重复序列在小麦族物种基因组中占很高的比例,在普通小麦中国春基因组中含量高达85%以上,但基因组中重复序列的结构与功能研究较为薄弱。重复序列可分为串联重复(Tandem repeats,TR)和散在重复(Interspersed repeats,IR),仅少数TR在分子标记、进化研究和细胞遗传学分析中得到应用。近年来,随着基因组测序与组装技术的提升以及成本的下降,小麦族中多个物种的基因组序列的完成,为从全基因组水平上分析小麦及其近缘物种的TR的结构与功能,以及大规模开发TR探针应用于染色体精细鉴定等提供了基础。本研究基于小麦及其近缘物种的参考基因组,结合基因组学和分子细胞遗传学手段,明确了基因组中的TR分布特征,发掘了一批新的寡核苷酸(Oligo)探针,能够在小麦染色体上产生清晰稳定的荧光原位杂交(Florescent in situ hybridization,FISH)杂交信号,并利用新探针对小麦易位染色体片段进行了精细鉴定。研究结果如下:1、基因组TR分布可视化网络服务工具的建立。针对串联重复序列家族在基因组中的物理特征,基于BLAST,我们构建了TR富集与物理分布网络服务B2DSC(http://mcgb.uestc.edu.cn/b2dsc)。B2DSC作为TR分布可视化工具,实现了基于TR设计FISH寡核苷酸探针的预评估,并对FISH杂交信号进行物理定位。同时基于FISH杂交结果,评估参考基因组局部区段重复序列的拼装质量,为细胞遗传学分析改进复杂基因组质量提供指导。2、小麦及近缘物种参考基因组的TR发掘。建立了包括小麦(AABBDD)、乌拉尔图小麦(AA)、节节麦(DD)、野生二粒小麦(AABB)和栽培大麦(HH)物种的非冗余TR(non-redundant TR,NR-TR)全基因组分布数据库(http://mcgb.uestc.edu.cn/tr)。发现小麦各染色体TR含量在2-5%之间,在A、B和D组染色体上非均匀分布,以D组染色体的TR密度最高。明确了小麦基因组中不同长度TR阵列在基因组的分布与富集特征,说明重复序列结构多样性对小麦基因组进化发挥了重要作用。3、小麦基因组TR与基因表达调控分析。发现1-10 bp TR和31-60 bp TR分别在高置信度(high confidence,HC)基因的转录起始位点(transcription start site,TSS)上下游50 bp和基因转录终止位点(transcription terminal site,TTS)下游500bp内相对较高富集。在TSS上游1 Kb内和TTS下游300 bp内出现50拷贝以上TR阵列的HC基因,常常表现为完全不表达或有中低表达。类萌发素蛋白基因家族分析,发现编码区插入了TR的基因完全不表达。对93个低拷贝TR阵列的基因分析,表现了潜在的pre-miRNA序列的存在,为开展TR对全基因组的表达调控网络研究奠定了基础。4、基于高拷贝TR的寡核苷酸原位杂交探针的发掘。在TR全基因组分析的基础上,开展TR阵列的聚类分析,从46类小麦高拷贝TR以及3类大麦TR中获得了16个新寡核苷酸探针。验证发现它们在小麦染色体上有比较清晰稳定的非变性荧光原位杂交(nondenaturing FISH,ND-FISH)杂交信号,且结合B2DSC进行的基因组物理定位,构建了一张TR探针的染色体物理定位整合图谱,大大提高了FISH鉴定小麦及其近缘属物种染色体特定区段的分辨率。5、小麦高富集的小卫星(minisatellite)序列的分布与进化研究。小麦基因组中一类44 bp的TR序列Ta-3A1,共有69,135个拷贝,总长约3.02 Mb,为拷贝数最高的小卫星序列。Ta-3A1主要富集于小麦3AL、5AL、7AS、7AL、5BL和5DS很短的区间内。序列的聚类分析与物理分布分析,结合小麦族代表性物种染色体的比较ND-FISH分析,发现Ta-3A1拷贝数和染色体位置的快速变化,与小麦族物种形成和多倍体化过程中的染色体重排事件有关。6、基于TR的寡核苷酸探针用于染色体结构变异精准鉴定。利用发掘的Oligo探针,对小麦-偃麦草导入系Z4、小麦-黑麦-偃麦草易位系品种Amigo以及“川麦62”的染色体进行了多重探针的FISH分析。准确鉴定了Z4的易位染色体(Tr-I)的易位断点,其中3A的断点确定在位于长臂的532.13 Mb区域,3DS的47 Mb区段插入到Tr-I的端部。FISH鉴定发现小麦品种Amigo具有小麦-黑麦1RS.1AL易位染色体,小麦7BS.7AS和7BL.7AL易位,还确定了Amigo的1B染色体随体区域,长穗偃麦草染色体片段约为120 Mb。利用多种TR-Oligo探针,将“川麦62”中5B-7B相互易位染色体的断点分别定位于5B的99-151 Mb和7B的310-379 Mb之间。证实多探针ND-FISH可大幅度提高小麦及近缘物种染色体区段重排的鉴定分辨率,实现小麦外源新种质的高效鉴定。综上,本研究围绕小麦及其近缘物种中的串联重复序列,开展生物信息学分析,开发了可展示全基因组TR染色体分布的在线网络服务,已成为物种基因组TR分析的共享平台。开发的新型基于TR的寡核苷酸探针,并构建染色体物理定位整合图谱,成功用于小麦外源染色体易位区段的精准鉴定,实现了分子细胞遗传学研究与基因组学新进展的紧密结合,研究结果对完善小麦基因组结构、功能与进化的理论和指导小麦分子染色体工程育种的实践都具有重要意义。
其他文献
我国经济在经过改革开放以来的高速发展后,经济发展速度向中高速增长的“新常态”转变,创新驱动逐渐取代投资驱动、消费驱动成为新常态下经济发展的新动力。党的十八以来,习近平
利用光能驱动的光催化反应净化水质以及利用光/电能催化还原氮气制备氨(固氮),已经成为一种低能耗、低污染且高效解决环境污染问题的有效方式。设计高效的催化剂成为光/电催化
创造性解决问题的元认知教学罗玲玲一只饿猫被关在特制的箱子里,箱外放着可口的食物,饿猫急得跑来跑去,偶然碰到了开关,门开了,饿猫饱餐一顿。这样重复多次,猫在反复尝试中学会了碰
<正>世界各地的神话、史诗、英雄传奇、民间故事等非物质文化遗产,如希腊神话主要载体之荷马史诗、北欧神话主要载体诗歌体《埃达》、印度神话主要载体史诗《罗摩衍那》《摩
嘉应观是我国历史上唯一记述治理黄河历史的庙观,也是河南省保存最完好、规模最宏大的清代建筑群,是黄河文化的代表之一。文化价值、建筑美学价值、文物保存价值十分丰富。
该研究问题指出,“基于社会经济,健康信仰和社会资本,冲突后脆弱国家南苏丹社会医疗保险(SHI)的前景如何?”.本研究采用健康认知模型(HBM),包括一般健康及其对(WTP)支付社会
语言表达能力以及语言沟通能力是促进人与人交流的一项必备技能,而边疆少数民族地区护生语言沟通能力对今后学习、以及生活等都具有特殊性作用,是提升护生在今后职业中沟通成
人体信息的数字化是将医学与信息技术、计算机技术、虚拟现实技术相结合的科技前沿性研究课题.许多国家已建立或正在建立虚拟人体模型.这种模型以人体断面连续切片为建模基础
内容我国已进入城镇化快速发展的阶段,这一阶段内在的和外在的条件要求城镇化必须走优质高效的道路。然而目前对城镇化质量的内涵还存在着争议。城镇化质量的本质就是要在城镇
最近几年电视综艺爆炸,网络综艺也异军突起,数量众多质量却参差不齐。2016年年底,一档网络综艺文化节目《见字如面》却以其独特的形式和丰富的人文精神及深厚情感迅速走红,被