论文部分内容阅读
山羊是重要的家畜之一,对于人类社会意义重大;然而目前在其开展的遗传育种工作总体滞后,其中主要一个原因是受限于不充足的基因组信息。辐射杂种遗传图谱被证明是遗传学研究的重要内容,随着高通量分型技术的发展,SNP基因芯片可发展成标记筛选和分型重要工具,用于构建近缘物种的超高密度遗传图谱。随着近两年国际山羊基因组合作项目的开展,各国多家科研机构整合资源,逐步高效推进多项山羊全基因组研究,包括山羊基因组测序计划、HapMap计划、SNP芯片计划、可持续性状QTL定位项目和抗病育种等。因此,本研究以山羊作为试验对象,建立山羊辐射杂种板为作图工具,并结合用牛和绵羊SNP芯片的方法首次构建了高密度的山羊全基因组辐射杂种图谱,一方面以更好地协助和验证山羊全基因组测序图,另一方面可进一步了解哺乳动物特别是反刍动物染色体结构的进化历史和理解其产生机制。主要结果如下: (1)使用成熟的山羊辐射杂种板建立体系获得121个初级的RH细胞系;使用了42个分子标记评估这些杂种克隆的保留率,从中筛查出90-93个对作图更有效的RH细胞系,建成第一套山羊全基因组辐射杂种嵌板,CHIRH5000。 (2)采用了110个候选的STS,EST,和基因标记在杂种嵌板上做基因型检测,在山羊第1号染色体上构建简单的连锁图,表明51个标记可以分成3个连锁群,其中最大的连锁群含26个分子标记,初步表明山羊辐射杂种嵌板完全有能力用于全基因组辐射杂种图谱的构建。 (3)采用牛BovineSNP50K和绵羊OvineSNP50K芯片的SNP为候选构图标记在杂种嵌板上做基因型检测,在已有的 RH作图方法的基础上做进一步的改进,首次构建了山羊全基因组辐射杂种图谱。最终的高密度的RH图谱含有30988个标记,覆盖山羊>98%的基因组。其中每个连锁群分别映射与山羊的每条染色体,分布获得30对染色体的各自的RH图谱,每条染色体平均含有1033个SNP标记,平常长度为226.54cR5000。 (4)采用检测候选 SNP转化为有效山羊 RH标记的能力、辐射杂种的供体基因组的保留率、辐射杂种图谱的分辨率等三种方法评估山羊全基因组辐射杂种图谱。结果说明了在山羊基因组信息不足够时,44,497个近缘物种SNP标记可以引入山羊 RH构图。辐射杂种的山羊基因组各个片段间的保留程度差异不大,平均标记保留率为27.2%,与其他哺乳动物的辐射杂种图谱具有可比性。辐射杂种图谱的分辨率在约82kb,表明理论上可用于任何基因的定位。 (5)山羊 RH图谱分别与山羊基因组染色体组装前的 scaffold/contig序列、Super-scaffold序列和染色体组装后草图序列做比较,用于国际山羊基因组测序计划的山羊基因组组装和验证。在山羊辐射杂种图谱与 scaffold数据比较,发现二者存在极高的共线性(>99.5%),然而在山羊辐射杂种图谱于supper-scaffold的比较则出现较多不一致的地方(共线性>97.0%),说明山羊基因组的scaffold/contig的重头拼接的高质量,而高级组装使用的Fosmid和Optical mapping依然需要辐射杂种图谱等其他独立图谱的协助和验证。 (6)山羊与牛的染色体的结构比较结果表明二者大尺度的染色体片段排列和山羊的同源片段排序一致,其中最大的差异在第9、14、13和X号染色体上。与其他染色体相比,X染色体与常染色体发生片段极少有交换、融合,但X染色体内的结构的重排发生最为频繁。通过分析牛羊9-14易位进化断点区域的序列的特征,发现其进化断点有不同程度的马赛克样的新插入序列。根据各个进化断点的序列结构特征比较,我们推测9-14易位是者两染色体融合及新着丝粒形成是发生在羊的祖先,而不是在牛的祖先。 (7)使用Evolution Highway等工具重新构建了哺乳动物包括牛、马、猪、狗、鸭嘴兽、人、恒河猴、小鼠的基因组和山羊辐射杂种图谱的比较图。先前被认为的牛或者反刍动物的104个家系特异中进化断点区域被证明为反刍动物特有进化断点区域。研究支持哺乳动物基因组的进化断点区域是非随机分布的理论,即有部分基因组区域更易断裂,发现染色体中端粒和着丝粒附近区域存在更多的进化断点区域。 (8)在山羊9-14易位的进化断点区的SD内鉴定到了3个ANKRD26家族的新成员,进一步统计了71个ANKRD26家族成员在哺乳物种中基因组的分布,发现ANKRD26家族在哺乳动物的扩张极可能伴随着染色体大片段的重排进行。功能预测表明 ANKRD26基因对染色体重排中的 DNA损伤和近着丝粒的染色体凝集和压缩负责。本研究作为证据支持已有的染色体进化假说,即近着丝粒非同源染色体上的非典型的同源重组能导致染色体保守区域的断裂和染色体的重排,促进物种分化。