癌症致病通路中互斥突变识别的统计模型

被引量 : 0次 | 上传用户:zhongyi02w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:随着高通量测序技术的不断改进和测序成本的下降,TCGA和ICGC等机构已积累了海量的癌症基因组变异数据,癌症基因的识别和预测已成为生物信息学研究的重点问题。本研究主要针对“互斥突变”的识别方法展开研究,重点介绍MEGSA算法的基本原理,通过模拟研究评价其检验效能,并将其应用于包含SNP和CNV的GBM数据,找出最优互斥基因集,为基因药物的研制和癌症的诊断与治疗提供依据。方法:了解癌症相关突变的研究进展,介绍现有识别互斥突变的方法,分析其基本原理及不足,总结出识别互斥突变的理想分析框架。MEGSA算法是目前为止识别互斥突变最优的算法。模拟分析中,固定MEGS基因数=3,按覆盖率?=0.1、0.2、0.25、0.3、0.4、0.5;样本量=50、100、200、300、400、500;随机突变基因数量=10、15、20、25、30;随机突变率=10%模拟突变矩阵,比较不同参数设置下的MEGS准确检出率。实例分析中,将包含261个病人、398个突变基因的GBM数据整理为二分突变矩阵,然后用R软件进行分析,初步寻找出GBM致癌通路上的互斥基因集。结果:模拟研究表明MEGSA识别互斥基因集的效能随覆盖率和样本量的增加而增大,而基因数的变化对其效能几乎没有影响。GBM突变数据经MEGSA分析,找到20个有意义的MEGS,共包含12个基因变异,其中SNP:RB1突变、TP53突变、IDH1突变、PTEN突变、NF1突变、SPTA1突变;CNV:CDK4扩增、CDKN2A缺失、MDM2扩增、EGFR扩增、PTEN缺失、PDGFRA扩增和一个CNV meta基因集(MET,CAP2A2,ST7-AS1,ST7,ST7-OT4)。最显著的MEGS包含三个基因变异:CDK4扩增、CDKN2A缺失和RB1突变。结论:MEGSA是一种相对灵活而有效的分析方法,不仅适用于位点突变数据,在包含拷贝数变异的数据中也有较好的检验效能。与Multi-Dendrix算法作比较,MEGSA具有较高的检验效能,其找出的突变基因除SPTA1外均已证实存在于GBM的致病通路中,且找出的CNV也证实与癌症的发生发展有关。但是MEGSA采用多路径搜索算法进行计算可能会丢失一些结果,且置换模拟需要较高的次数才能得到相对理想的结果,需要更大的计算机CPU和运行内存。
其他文献
目的对肺结核患者咯血的临床护理效果进行研究。方法经过对本院2016年7月至2017年7月收治的80例肺结核咯血患者临床资料展开回顾分析,随机分为两组各40例,对照组选择常规护理
目的:了解新型农村合作医疗监管部门和服务提供方对于"按人头支付"改革措施的观点及预期。方法:采用问卷调查和关键知情人访谈的方法,对包括社区卫生服务中心、镇合作医疗管
现行用电设备中非线性元件大量使用,造成电网中大量谐波的产生,对电网造成严重污染,采用单调滤波装置对各次谐波的吸收,抑制谐波电流的放大,对电网起到一定的净化作用,对电网
独立学院是近年来迅速发展起来的一种新型的办学模式,随着办学规模的不断扩大,在办学中坚持教学中心地位,合理定位人才培养目标,深化教学改革,创新教学管理机制,保证人才培养
<正> 本文简要地介绍了可编程控制器PLC的基本组成、工作原理、编程方法及典型应用实例,供初学者入门学习参考。 什么是PLC 美国数字设备公司(DEC)于1969年研制成功了一种工
<正>近年来,随着生活水平不断提高,消费者对食用油的需求呈现出多样化趋势,传统的调和油和色拉油在一定程度上已经难以满足消费者对美味、营养、健康的需求,而具有营养性、保
介绍了利用MATLAB软件对CT切片图像进行三维重建的方法与程序实现。分别对体绘制法、面绘制法实现的三维重建进行了研究与讨论。利用MATLAB软件制作GUI界面,实现对肺部CT图像
在中国画领域里,工笔重彩画无疑是与色彩结合最为紧密的种类,工笔重彩是绘画创作中色彩语言的变化与色彩观念的转变有着密不可分的联系。而工笔重彩的色彩与材料运用是更深人
一个流派的风格是由多种因素组成的,而中国古筝诸流派风格的最大区别实际上就在于左手以韵补声特色上的不同。各个古筝流派的左手作韵特色都深刻地反映了,各个筝派受到他们所
影视、动画是视听的艺术,它的物质载体是画面和声音,点、线、面是视觉艺术的重要构成部分,是美术、设计领域中造型的基本元素。在听觉上,点、线、面通过不同的特征形式存在于