【摘 要】
:
结构变异(SV)在人类基因组中广泛存在。结构变异在长度,来源,功能影响上区别于其他类型的变异。人类基因组计划中结构变异检测的目标是通过在少量的正常个体中使用双端测序方
论文部分内容阅读
结构变异(SV)在人类基因组中广泛存在。结构变异在长度,来源,功能影响上区别于其他类型的变异。人类基因组计划中结构变异检测的目标是通过在少量的正常个体中使用双端测序方法来识别和分类超过5kb的In Del(插入和删除)和倒位变异。在SV的特性描述上的进展有限,大部分的SV依然是未知的。千人基因组计划的数据集中包括26个种群。其中的超种群共包括2504个个体。我们将其按照大陆划分,以削减时间和复杂性。我们的研究基于SAS超种群(CHS,CHB)。我们使用人群参考基因组来检测变异,使用工具来比对,然后检测SV。有两种方法执行此过程,我们采用的第一种方法使用了主流的工具来进行比对。当我们得到SAM格式的准确read比对结果后,我们需要将其转换为BAM格式。用于建索引,read比对和变异检测的工具分别是BWA,samtools和Delly,GATK。这种方法虽然高效,准确,但是消耗了太多时间,代价大。第二种方法是直接采用了来自于千人基因组计划的VCF数据。这两种过程是为了得到不一致的read。两种方法都更好用。当我们从群体样本中得到不一致read时,我们将会合并不一致read到参考基因组中,们得到了一个新的参考基因组。这个新的参考基因组比之前的要更好。然后我们重新比对reads到这个新的参考基因组上。比对后的reads创造了新reads簇。超种群中大部分的变异被发现了。他们大部分是来自于千人基因组计划。所有在SAS超种群中发现的变异都来自低覆盖的数据。这意味着种群特异变异保持非特性描述。这是因为大量的变异是低频的。本研究中,我们将收集并使用千人基因组计划的高不确定SAS系谱的全基因组测序数据。
其他文献
目的:明确多重用药和CYP2C19基因多态性与导致氯吡格雷抵抗(Clopidogrel resistance,CR)是否具有相关性。方法:选取2015年9月~2017年9月期间于中国医科大学附属第一医院心内科
随着集成电路制造工艺的改进,集成电路的特征尺寸越来越小、单位面积上集成的器件越来越多、阈值电压下降,软错误对集成电路的可靠性影响越来越大。寄存器是处理器中的关键部
目的:目前针对IVADA的血管内治疗采取何种的治疗手段(重建与封堵)仍然存在分歧与争议。病变侧是否是优势椎动脉、夹层动脉瘤的大小及形态、患者临床表现及症状、是否累及小脑
发展生物基高分子聚合物替代石油基高分子材料己成为国内外研究热点之一。木质素富含芳环结构,是一种重要的可再生资源,具有来源丰富、可生物降解以及环境友好等优点,可用于合成生物基高分子单体。开发木质素基高分子聚合材料具有重要的研究意义,是实现木质素高值化利用的重要途径。本研究以Indulin AT木质素为原料,通过溶解分级中的有机溶剂法、有机溶剂-凝胶色谱结合法对木质素原料进行分级,获得了不同相对分子质
本论文共四个试验,研究分析了福建省常见菌糠营养特性及游离棉酚含量;研究不同水平CaO、Ca(OH)_2、CaO+3%尿素及Ca(OH)_2+3%尿素等4种碱贮处理对真姬菇菌糠营养特性和游离棉酚的影响;利用体外产气法筛选基于复合碱贮处理菌糠山羊TMR配方;基于复合碱贮菌糠配制的育肥羊TMR饲养试验,旨在为菌糠科学开发利用提供理论依据。试验一福建常见菌糠营养成分及营养特性分析。采用CNCPS法评价福建
随着云计算和云存储等产业信息系统的飞速发展,在行业内及用户中已经有了广阔的前景,并且在两会期间马化腾等互联网企业代表提出的产业互联网,数字化建设等建议提出在智慧城
可重构处理器由于其结合了专用集成电路高能效和传统通用处理器高灵活性的优点,逐渐成为了人们的研究热点。但是因为其采用了不同于传统处理器的硬件结构,使得现有的编译技术
目的:探索可能导致剖宫产瘢痕妊娠(cesarean scar pregnancy,CSP)治疗后再发生的相关因素,为预防及预测CSP的再发生提供依据。方法:收集2014年7月至2018年7月于我院诊断并行手
随着电力电子技术的高速发展,各种电力电子装置的推广和使用会严重污染电网系统的电能质量。有源电能质量综合补偿器(Active Power Quality Combined Compensator,APQCC)可有
由于人为因素导致的环境问题已成为全球共同关注的一个热点,其中染料污染是最让人头痛的一项。商业染料用途广泛,染料污染主要来源于纺织,印染等行业产生的印染废水,若直接排