人类基因组分析中的缺失偏倚效应研究和拷贝数变异的突变估计

来源 :复旦大学 | 被引量 : 0次 | 上传用户:jeff1986928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术的革命将遗传学的研究引入了组学的时代,通过芯片技术的运用产生了大量的遗传数据。为了深入地对数据进行挖掘,其他学科,如统计学、信息学等,与遗传学的结合越来越紧密。本文就五年来本人攻读博士学位期间的工作进行了总结,期望通过对两部分工作的介绍,展示统计学运用于解决遗传学问题的实例。其一,我们对高通量单核苷酸多态分型平台的缺失偏倚现象及其对后续分析的影响进行了探究。高通量、低成本的分型平台的出现,使全基因组关联分析成为了可能。但是研究者往往将关注的目标及于如何提高分型的准确率,而忽视了另一质量问题——缺失数据的存在。为了研究缺失现象对全基因组关联分析的影响,我们对四个主流分型平台(TaqMan(?) SNP分型平台、GenomeLabTM SNPstream分型平台、BeadLab (Illumina)分型平台和Human Mapping 500K (Affymetrix)芯片)的缺失数据进行了重测序分型,实验证实了缺失偏倚现象在多个平台中均普遍存在。进而,我们从理论上分析了缺失偏倚对后续分析的影响,如等位基因/基因型频率的估计、哈迪——温伯格平衡检验和不同疾病模型下关联分析统计功效的影响等。研究显示,缺失偏倚往往导致关联分析统计功效的下降,而且这种下降通常要比单纯的样本缺失造成的影响严重。我们还分别比较了缺失偏倚、分型错误对频率估计、关联分析的影响。通过分析获知,大多数情况下因为分型质量问题造成的分析偏差可以通过提高分型响应度,即使会牺牲一定的分型准确率来尽可能避免、减小。这一发现提示我们过去通常对处于分型边界的读点进行不判读的做法需要被修正。如果是为了降低分析偏差,在全基因组关联分析中,分型响应度和错误率的筛选标准要互相配合。我们建议修改现行的质量控制标准,可以适当增加响应度的阈值而降低对分型准确率的要求。其二,我们提出了近似估计拷贝数变异突变率的统计新方法。人类基因组中存在着拷贝数变异,而且这种变异和孟德尔遗传疾病、复杂疾病以及进化中的基因组可塑性相关。为了更好的理解拷贝数变异相关性状的成因,研究拷贝数变异的生成机制、估计它的突变率是十分重要的。多项用于揭示拷贝数变异成因的研究已经开展起来;但是从基因组水平对拷贝数变异突变率进行实验估计还是一个不现实的问题,它需要大量的样本量和精确的分型技术。本研究提出了一种可以运用群体基因型数据对拷贝数变异突变率进行近似估计的方法。这一估计可以通过基因组中不同拷贝数变异的比较,找寻到拷贝数变异的突变热点。运用该方法我们分析了来自HapMap计划的三个群体、4,330个拷贝数变异位点,发现大多数的拷贝数变异突变率大致在10-5/代水平,这与分子实验观察到的零星突变率估计相一致。值得一提的是,有132(3.0%)个拷贝数变异的突变率可达10-3/代水平,被认为是突变热点。进一步的分析发现,基因组结构和重排机制的不同可能造成了人类基因组中拷贝数变异热点的存在。在不久的将来,由二代测序技术产生的海量数据将不断地涌现出来,许多悬而未决的遗传问题有望获得解决。对这些数据的挖掘工作离不开统计学、信息学等的运用,让我们做好准备迎接生命科学发展的这一黄金时代的到来。
其他文献
招贴是视觉传达设计中的一种,现代招贴设计中使用最频繁、最广泛、最便利、最快捷和最经济的传播手段与传播方式之一。作为信息的传播载体,招贴设计以简洁明了的设计特性存在
@@为了摆脱钢铁生产对焦煤的依赖;探寻减少资源、能源消耗,降低污染排放,紧凑的、经济生产规模小的新的钢铁生产流程,实现钢铁生产的“紧凑化”;为了减少CO2排放,适应日益提高的环
树枝的报复斧头砍断了一根树枝,树枝决心报复斧头。斧头是那么强大,自己是那么弱小,怎样才能报复它呢?树枝挖空心思,想出了一个好主意。树枝忍痛把自己截成了一段斧柄,然后去
本报讯 (记者钮怿 通讯员鲁军)以政府投资和使用国有资金的项目为重点,上海将集中力量查找和解决一批工程建设领域的突出问题。昨天上午,在中央召开的全国工程建设领域突出问题
报纸
目的:参考国际上核心结局指标集的构建方法与程序,运用德尔菲法及专家共识会议方法建立中医药治疗高脂血症的核心结局指标集,为中医药治疗高脂血症结局指标的选择提供参考资料,为该类中医药临床评价选择适宜的结局指标提供借鉴。方法:本研究首先通过系统、全面的文献回顾,收集国内外中医药治疗高脂血症相关的结局指标,进一步整理出备选结局指标条目池,再根据国际公认的德尔菲法,经过连续三轮进阶式调查对每一个候选结局指标
在"一带一路"倡议下,语言成为对外交往活动的重要媒介。广西作为与东盟国家联通的"桥头堡",角色的定位赋予了广西更多先行的推动力,而外语人才的培养成为其中一个关键的因素。广
作为观察世界与认识世界的重要手段,80%外部世界信息通过视觉获取。随着信息技术、图像处理技术的发展,可以赋予移动机器人以视觉认知功能,使其具有通过图像认识世界的能力。近年来,随着移动机器人应用场景不断增加,利用视觉信息对其进行控制即视觉伺服控制具有重要的理论意义与潜在应用前景。考虑到移动机器人所具有的非完整约束以视觉伺服领域的视觉可见性约束,本文利用模型预测控制(MPC)设计视觉伺服控制器。所研究
针对新型核产品工艺过程复杂,生产数据信息庞大,生产报表统计困难和可追溯性差等生产质量管理现状,开展了生产质量信息管理技术研究。绘制了产品制造过程业务流程图和业务流
随着高速铁路、新能源、风电等新兴行业的快速发展,中国“一带一路”和“长江经济区”国家战略的快速发展,新兴融资租赁行业处于高增长状态,其发展也离不开资金的支持。融资
研究目的:海外人才拥有较高的学术技术水平和国际化视野,是我国经济社会建设发展的重要力量。本文以重庆市公立医院引进的海外人才为研究对象,针对该群体现状进行调研分析,结