论文部分内容阅读
狼(Canis lupus)和家犬(Canis lupus familiaris)都属于食肉目(Carnivora)犬科(Canidae)犬属(Canis)。因其相似的外表,一直以来关于二者的进化关系都是研究热点。但是到目前为止关于二者的研究主要集中在线粒体以及基因组上。2004年美国国家人类基因组研究协会(NHGRI)宣布第一个家犬的基因组序列草图组装完毕,并被加入到公共数据库中供研究者免费使用。基于家犬的全基因组数据,我们对狼和家犬进行血液转录组分析,得到了以下结果:1、通过对2只家犬和3只狼的血液转录组进行测序,总共得到了30.87G的原始数据,经过过滤后分别得到5.33G、6.24G、6.4G、6.28G和6G的高质量的reads,占总数据量的97%。通过与家犬参考基因组的比对,结果显示,每个样本均有85%以上的reads比对到参考基因组上。其中有超过60%的reads有单一的比对位点,比对到多个位点的reads低于30%。经过组装后,我们获得了26212个基因,其中新基因1989个;总共鉴定出33229个转录本,其中新转录本1993个。2、基于Cufflinks组装的结果,我们使用DESeq2进行差异表达基因的筛选,设置阈值q-value<0.05,再经过与数据库的比对及手动注释后,总共筛选出了524个差异表达基因,其中新基因35个。在这524个差异表达基因基因中,相对于家犬有180个基因上调,包括12个新基因;344个基因下调,其中新基因23个。在这些差异表达基因中,有3个基因只在狼中有表达,7个基因只在家犬中有表达。3、GO富集分析结果显示,所有的差异表达基因中总共有272个基因被富集到703条GO terms中,其中522条富集到生物学过程中,100条富集到细胞组分中,81条富集到分子功能中。设置p-value<0.05,来进一步进行显著性分析,结果所有的差异表达基因被显著富集到382个GO terms中,占所有的terms的54%。随后为了更清晰的观察狼和家犬差异表达基因涉及的生物学过程,我们分别对二者的高表达的差异基因进行GO富集分析,结果发现,在狼的上调基因中有6个基因富集到了狼的先天性免疫应答中,推测这可能与狼在抗病毒的能力上高于家犬相关。4、KEGG通路分析结果显示,总共218个基因富集到了12个KEGG通路上,包括细胞循环、帕金森综合征、氧化磷酸化、蛋白质在内质网上的进程以及p53信号通路等。本研究首次通过血液对狼和家犬的转录组进行测序和分析,为进一步探讨狼和家犬的进化关系,揭示狼和家犬在血液免疫方面存在差异的原因提供血液转录组方面的依据。