论文部分内容阅读
罗布麻(Apocynum venetum),又名红麻,夹竹桃科(Apocynaceae)多年生宿根草本植物,是我国宝贵的野生植物资源,作为抗逆性极强的生态经济型植物,其茎杆可制成纤维,叶片可以炒茶,也是蜜源植物。罗布麻的根、茎、叶和花均可入药,主治高血压和高血脂等病症,1977年被《中华人民共和国药典》录入。植物全基因组测序是分析解决基因组成、成分分析、代谢通路等关于其本身的最基本的信息短缺问题,为物种之间的亲缘关系、分化时间和种间进化关系等信息作出科学的分析和支持。而罗布麻关于基因测序方面的相关研究甚少,NCBI数据库中罗布麻Genomes仅有89条序列(截止2020年6月14日),极少数的罗布麻基因组序列,使得其基因组学的研究滞后,罗布麻的全基因组破解亟需开展。本文利用Pacbio Sequel测序平台、通过10X Gemonics测序技术、Hi-C辅助组装等方法,对罗布麻进行全基因组测序、组装以及分析,获得如下结果:1.罗布麻基因组大小初步预估为254.40Mbp,是复杂基因组。全基因组Survey调查调查结果表明,罗布麻基因组大小初步预估为254.40Mbp,其杂合率和重复率分别是0.63%和40.87%,为复杂基因组;采用k-mer=41,进行初步组装,得到conting N50为3,841bp,总长为223,949,699 bp,进一步组装得到scaffold N50为6,196bp,总长为227,322,054bp;对罗布麻全基因组数据进行SSR分子遗传标记预测,鉴定共有101,918个SSR,不同类型的核苷酸重复序列存在较大差异,其中单核苷酸重复序列最多,六核苷酸重复序列最少。2.本研究首次成功组装出罗布麻全基因组草图(245 Mbp),确定了其染色体数目为2n=22。通过Hi-C辅助组装技术组装的罗布麻基因组super-scaffold N50为19.8 Mb,同时锚定到11条染色体上。通过对罗布麻全基因组序列注释,最终共预测出22,552个非冗余的蛋白质编码基因,90.24%的基因含有保守蛋白结构域,78.70%的基因比对到已知代谢通路上,95.9%的基因有功能注释,55.5%的基因具有GO功能注释。我们利用单分子测序和基于Hi-C的染色质相互作用图谱,提出了一个高质量的罗布麻染色体水平参考基因组。3.基因组比较分析发现罗布麻属与牛角瓜的亲缘关系最近。通过对罗布麻进行基因组比较分析,一共聚类出43,837个基因家族,共有基因家族为3,084个,其中扩张了 405个基因家族,包含1,524个基因,收缩了 342个基因家族,包含167个基因,这可能是由于物种在各自进化过程中发生了独立的不同程度的基因(家族)的获得与丢失。基因家族系统进化分析结果表明,罗布麻属的分化时间大约在35.9(26.7-46.8)百万年左右,而罗布麻与大麻状罗布麻的分歧时间大约是在6.5(3.3-9.9)百万年左右。基因家族聚类发现长春花、罗布麻、大麻状罗布麻和牛角瓜关聚为一类,罗布麻属和牛角瓜关系最为密切,这与被子植物分类法Ⅳ(APG Ⅳ)高度一致。4.通过罗布麻全基因组注释结果鉴定出了多种合成黄酮类化合物的相关基因。罗布麻全基因组注释结果中与黄酮类化合物合成的相关基因,包括O-甲基转移酶、花青素还原酶、查尔酮异构酶、无色花色素还原酶、异黄酮还原酶、无色花青素加双氧酶、查尔酮合成酶基因等,同时也鉴定出79个与转录调控基因互作有关的AP2/ERF转录因子。