论文部分内容阅读
隐孢子虫病(Cryptosporidiosis)已经成为全世界重要的新发人兽共患病之一,被认为是仅次于轮状病毒感染,引起儿童腹泻和死亡的第二大病因,也是犊牛腹泻性肠道疾病的主要病因。在常见的感染人的隐孢子虫虫种中,微小隐孢子虫(Cryptosporidium parvum)和人隐孢子虫(Cryptosporidium hominis)几近达到人隐孢子虫病病因的90%以上。GP60基因是隐孢子虫基因组中最具多态性的基因位点之一,所以它通常用于C.parvum、C.hominis以及其它亲缘关系较近的虫种的分型。
本研究通过对PubMed和WebofScience数据库进行文献检索,及对GenBank进行序列检索,关键词为“Cryptosporidium”、“GP60”和“GP40/15”下载整理了相关文献及序列。提取出与C.parvum流行病学相关的内容,统计全球分布情况,并使用ArcGIS对C.parvumⅡa、Ⅱc、Ⅱd亚型家族全球分布情况及中国地区C.parvum各亚型分布情况进行作图,然后计算比例相似性指数(PSI),计算各个国家之间的生态位重叠(共生)模式。阐明了C.parvumⅡa、Ⅱc及Ⅱd亚型家族在全球的分布规律以及我国Ⅱd亚型家族的群体遗传结构与世界其他国家的异同。
本研究将单细胞全基因组扩增技术与三代测序技术结合起来,探索一种适用于少量隐孢子虫样品的纯化与WGA扩增方法。取1-2g新鲜粪便样品,经除脂、1∶1蔗糖溶液梯度离心及氯化铯梯度离心后,使用显微操作仪对纯化后的卵囊进行挑选,接着进行破壁处理,并进行单细胞全基因组扩增,使用AmpureXP磁珠对WGA产物进行纯化,并检测其浓度和纯度,对质量合格的样品进行建库及上机三代测序,最后对下机数据进行质控和基因组拼接。样品经纯化扩增后,DNA含量经扩增后由pg级达到μg级,在保证纯化质量的同时确保损失在可以承受的范围内,并满足Nanopore测序技术的上机要求(Nc/Qc≤1.5,样品总量≥5μg)。经过建库测序后,产出数据长度主要集中在5kb左右,readsN50在6K至7K之间,数据GC含量分布基本正常。测序reads质量绝大多数都大于Q7,测序质量较好。拼接后的基因组大小为9.08M,N50达1.11Mb,CompleteBUSCOs的比例达到98.4%,说明这种方法的结合是可行的。此研究很好的解决了部分样品样品量小及可能存在混合感染的问题,为隐孢子虫基因组测序提供一个新的思路。
从河南和新疆地区共收集C.parvumⅡd亚型家族阳性样品53份,其中包括ⅡdA14G1(10)、ⅡdA15G1(11)、ⅡdA19G1(22)、ⅡdA20G1(10),样品经纯化后,通过单细胞分离技术与二代Illumina测序技术相结合。对下机数据进行质控,并与参考基因组进行比对及变异检测和变异注释,利用全基因组SNP数据进行群体遗传学研究,构建了ML进化树,进行了主成分分析和群体结构分析,发现国内不同地区微小隐孢子虫多态性较低,部分地区群体内发生了遗传重组。
最后构建了隐孢子虫数据库,包括Genomics及GP60两个模块,以及Blast、Featuresearch、JBrowse、Ftpdownload四个工具。本数据库系统不仅提供了丰富的隐孢子虫相关数据的展示方法,也在此系统上进行了数据检索、文件管理和相应的授权管理等。它能够很好地满足隐孢子虫领域科研工作者在研究过程中对数据的展示、查看及下载的需求。
本研究通过对PubMed和WebofScience数据库进行文献检索,及对GenBank进行序列检索,关键词为“Cryptosporidium”、“GP60”和“GP40/15”下载整理了相关文献及序列。提取出与C.parvum流行病学相关的内容,统计全球分布情况,并使用ArcGIS对C.parvumⅡa、Ⅱc、Ⅱd亚型家族全球分布情况及中国地区C.parvum各亚型分布情况进行作图,然后计算比例相似性指数(PSI),计算各个国家之间的生态位重叠(共生)模式。阐明了C.parvumⅡa、Ⅱc及Ⅱd亚型家族在全球的分布规律以及我国Ⅱd亚型家族的群体遗传结构与世界其他国家的异同。
本研究将单细胞全基因组扩增技术与三代测序技术结合起来,探索一种适用于少量隐孢子虫样品的纯化与WGA扩增方法。取1-2g新鲜粪便样品,经除脂、1∶1蔗糖溶液梯度离心及氯化铯梯度离心后,使用显微操作仪对纯化后的卵囊进行挑选,接着进行破壁处理,并进行单细胞全基因组扩增,使用AmpureXP磁珠对WGA产物进行纯化,并检测其浓度和纯度,对质量合格的样品进行建库及上机三代测序,最后对下机数据进行质控和基因组拼接。样品经纯化扩增后,DNA含量经扩增后由pg级达到μg级,在保证纯化质量的同时确保损失在可以承受的范围内,并满足Nanopore测序技术的上机要求(Nc/Qc≤1.5,样品总量≥5μg)。经过建库测序后,产出数据长度主要集中在5kb左右,readsN50在6K至7K之间,数据GC含量分布基本正常。测序reads质量绝大多数都大于Q7,测序质量较好。拼接后的基因组大小为9.08M,N50达1.11Mb,CompleteBUSCOs的比例达到98.4%,说明这种方法的结合是可行的。此研究很好的解决了部分样品样品量小及可能存在混合感染的问题,为隐孢子虫基因组测序提供一个新的思路。
从河南和新疆地区共收集C.parvumⅡd亚型家族阳性样品53份,其中包括ⅡdA14G1(10)、ⅡdA15G1(11)、ⅡdA19G1(22)、ⅡdA20G1(10),样品经纯化后,通过单细胞分离技术与二代Illumina测序技术相结合。对下机数据进行质控,并与参考基因组进行比对及变异检测和变异注释,利用全基因组SNP数据进行群体遗传学研究,构建了ML进化树,进行了主成分分析和群体结构分析,发现国内不同地区微小隐孢子虫多态性较低,部分地区群体内发生了遗传重组。
最后构建了隐孢子虫数据库,包括Genomics及GP60两个模块,以及Blast、Featuresearch、JBrowse、Ftpdownload四个工具。本数据库系统不仅提供了丰富的隐孢子虫相关数据的展示方法,也在此系统上进行了数据检索、文件管理和相应的授权管理等。它能够很好地满足隐孢子虫领域科研工作者在研究过程中对数据的展示、查看及下载的需求。