基于EigenGWAS的基因组选择位点检测方法及其云计算平台研发

来源 :浙江大学 | 被引量 : 0次 | 上传用户:q396782458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“物竞天择,适者生存”,这是达尔文进化论的核心观点。上世纪以来,结合新兴的群体遗传学与基因组学,达尔文进化论的相关研究走进了一个全新的阶段——科学家们开始研究基因组中有哪些基因位点受到了自然选择,以此来追溯和剖析物种起源进化的历史和复杂的环境适应性机制。探查基因组自然选择位点的传统方法,特别以遗传分化指数Fst为代表,均要求对群体有明确的亚群分类。但目前测序成本与表型收集成本之间还存在很大差异,导致大量的基因组数据没有对应的表型数据,而对于这些没有亚群标签的数据,传统方法就无法直接搜索候选群体基因组中的选择位点。2016年,一种全新的群体基因组选择位点探查方法EigenGWAS诞生,该方法结合基因组矩阵特征值分解和全基因组关联分析,提供了一种基于内蕴分组、从而不需要亚群信息也能进行选择位点搜索的“无监督式”方法,很大程度上解决了传统Fst分析所带来的分群难题。目前,EigenGWAS只适用于玉米、棉花、人类、动物等异交群体的选择位点分析,不能分析农业领域内常见的各类作物自交群体;此外,各种基于EigenGWAS方法开发的计算机软件均要求复杂的运行环境配置和命令行操作,结果可视化程度较低,使用较为不便;软件的计算效率也无法适应当前数据量激增所带来的计算需求。基于以上现状,本研究发展了适用于自交群体的EigenGWAS方法,并将其与原有框架进行整合,形成了适用于一般群体基因组选择位点检测的EigenGWAS方法。通过模拟研究和在拟南芥群体、大山雀群体、狗群体和中国人汉族群体中的真实数据分析,本研究验证了EigenGWAS方法在探究群体基因组选择位点时的有效性,分析发现的各类选择位点,为生态学、人类遗传学、动植物育种学等领域的研究提供了十分有价值的参考。此外,本研究利用C语言和R语言混合编程技术开发了全新的EigenGWAS软件,并将其部署到了云计算平台上(www.eigengwas.com)。新开发的软件具有用户友好型界面和丰富的结果可视化功能,用户无需任何软件安装,通过浏览器访问云平台就可以在线进行基因组选择位点的扫描分析。本研究发展的方法和云计算平台,将极大地方便相关研究人员的工作,为相关科学领域提供简单易用、稳定高效的分析工具。
其他文献
新疆位于我国西北部,是我国面积最大的省份,湖泊众多,气候环境多样。由于其地处偏远,部分地区环境恶劣,新疆湖泊虽储藏着巨大的微生物资源,关于其湖泊微生物多样性的报道却较少,且主要集中于对盐湖非培养微生物或者是嗜盐微生物的研究。本研究通过低温寡营养的培养方式对高山淡水湖喀纳斯湖、河流尾闾微咸水湖乌伦古湖以及高山盐湖阿牙克库木湖的湖水及土壤样品进行可培养细菌多样性分析。共分离获得326株细菌,其中从乌伦
NDE1(Nuclear distribution protein nud E homolog 1)是动力蛋白Dynein的重要调节蛋白之一,与严重的人无脑回小头症(extreme microcephaly with lissencephaly)有关。NDE1通过调控Dynein的亚细胞定位,参与了细胞器定位、有丝分裂和纤毛发生等生理过程。Nde1敲除小鼠的皮质神经前体细胞会产生纺锤体组织紊乱和有
铁是地壳中含量最丰富的金属元素之一,同时也是植物生长发育过程中所必需的微量元素,在光合作用、激素的合成、线粒体呼吸以及氮同化等生命进程中发挥着至关重要的作用。但土壤中大部分的铁以矿物态或难溶性化合物形式存在,植物难以有效利用。双子叶和非禾本科单子叶植物通过机理I吸收土壤中的铁,它包含质子外排,Fe3+的还原和Fe2+的运输三个步骤。对拟南芥而言,Fe3+的还原最为重要,也被认为是整个铁吸收过程的限
病毒是海洋环境最丰富的一种生命形式,海洋病毒能够感染海洋中所有的生物。病毒在浸染宿主后,可以通过影响宿主的生命活动以及代谢过程,直接对海洋环境中的生物化学循环产生重要影响。目前,对海洋病毒的研究主要集中在浅海海域的DNA病毒。但是,对于深海环境中的病毒,尤其是深海RNA病毒还知之甚少。因此,本论文对深海沉积物样品中的RNA病毒进行大量分析,这有助于深入了解深海环境中的RNA病毒。为了探索深海环境中
生物体通过复杂的应激反应机制来应对不断变化的自然环境。目前相关研究多关注蛋白编码基因的功能,而长链非编码RNA(long non-codingRNA,lncRNA)的应激调控作用尚不清楚。本研究以黑腹果蝇(Drosophila melanogaster)为对象,从长链非编码基因的角度研究黑腹果蝇胁迫应激反应,利用非生物胁迫处理的黑腹果蝇RNA-seq测序数据,分析了胁迫诱导的差异表达lncRNA基
泛素化修饰是真核细胞中广泛存在的、能参与多个生理过程的翻译后修饰。嗜肺军团菌效应蛋白SidE家族所介导的非经典泛素化修饰能产生ADPR-Ub、PR-Ub,并能通过磷酸核糖基将Ub共价连接到Rab33b等底物上,该泛素化修饰不依赖于“E1-E2-E3”和ATP。累积的ADPR-Ub、PR-Ub打破宿主泛素化系统的平衡,Rab33b等底物被修饰后干扰了膜泡转运,SidE家族严重干扰了宿主细胞正常生命活
了解高寒地区不同土地利用类型下土壤养分化学计量特征及其影响因素可为评估脆弱生态系统土壤质量和功能提供参数。通过测定青海省东部24个样点0—30 cm土壤基本理化性质(pH、容重BD、孔隙度Ps、黏粒含量Cy、土壤含水量SWC、有机碳SOC、全氮TN、全磷TP、速效氮AN和速效磷AP),并提取各样点环境因子数据(年均温MAT、年均降雨量MAP、年均蒸发量Ea、植被归一化指数NDVI、海拔ALT、坡度
在异质性生境中,种内功能性状变异有助于植物对环境的适应,进而可影响种群更新、群落构建和生态系统过程。本研究以千岛湖片段化森林生境中的常见种檵木(Loropetalum chinense)和短尾越橘(Vaccinium carlesii)为对象,测定了两种植物共400株幼苗和400株成树个体水平上的叶功能性状(叶面积、比叶面积、叶绿素浓度、叶干物质含量、叶全碳、全氮、全磷含量、叶碳氮比)和相关生境因
着丝粒是细胞分裂必需的元件之一。特异性定位于着丝粒核心区域的CENP-A/Cnp1核小体是动粒组装的基础,对有丝分裂和减数分裂的染色体分离起着关键作用。本课题利用裂殖酵母中特定遗传筛选系统寻找作用于CENP-A/Cnp1核小体组装和定位的基因,揭示了新的定量调控着丝粒内CENP-A/Cnp1核小体定位的机制。前期研究中证明MBF转录因子复合物可以通过转录水平调节CENP-A/Cnp1核小体的定位水
蛋白质是一切生命的物质基础,其合成和降解受到严格且精确的调控。泛素-蛋白酶体系统(the ubiquitin-proteasome system,UPS)介导真核细胞内80%以上蛋白的降解。26S蛋白酶体对维持正常的生理过程是必不可少的,然而有关蛋白酶体调控机制的研究仍非常有限。我们发现,蛋白酶体亚基Rpt2的N-肉豆蔻酰化可以介导蛋白酶体的膜定位。本课题聚焦于膜定位蛋白酶体在高等生物体内的功能研