基于生物信息学的复杂疾病诊断模型研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:jian_mei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类各种常见疾病都属于复杂疾病,其是多基因、多因素、不同遗传背景以及生存环境等共同作用的结果。目前复杂性疾病的分子机制研究存在一定局限性,而生物信息学的发展大大提升从系统生物学层面进行复杂疾病分子标志物的发现以及疾病诊断、预后预测等研究。基于此,我们拟以具有较高发病率的甲状腺肿瘤为切入点建立生物信息学方法识别和预测复杂疾病个体化诊疗中的新型分子标志物的新型研究模式,并探索利用临床信息进行疾病发生和发展的预测技术和方法,建立基因表达及临床信息混合预测模型,提高个体化医学中的预测精度和鲁棒性问题。  首先,依据术后病理学诊断结果将患者分为良、恶性甲状腺结节组,收集所有患者包括人口学、临床体征、实验室检查及B超检查结果共23项。经随机森林法共筛选出7个意义变量进入预测模型,包括年龄、结节触诊硬度、超声下结节形态、回声类型、钙化情况、囊性变程度、结节质地。在3个测试集中预测准确性分别为82.3%,81.4%和81.9%。  其次,我们对公共数据库进行数据挖掘,以GSE293153作为训练集,建立两步法进行肿瘤标志基因组合的筛选模式,发现以DPP4,SCG5和CA12三个基因组合的表达量构建模型可以较好地预测良、恶性甲状腺肿瘤,并在3个独立的公共数据库GSE33630,GSE27155,GSE36783进行验证。  再次,我们收集了仁济医院70例甲状腺结节标本,建立荧光定量PCR(QPCR)法检测3个基因组合的表达量,利用贝叶斯模型平均法计算预测概率的工作流程,并采用留一法(leave-one-out)进行交叉验证,其对甲状腺肿瘤预测敏感性,特异性和准确性分别为93.5%,94.9%以及94.3%。同时,通过免疫组化法在蛋白水平上对DPP4,SCG5和CA12三个蛋白在良、恶性甲状腺结节中表达差异进行验证,发现与基因表达水平一致。  最后,我们收集来自2个临床中心的共142例病例,比较基因模型、临床变量模型及混合模型对甲状腺癌的预测能力。结果表明,基因表达模型预测敏感度高,临床资料预测模型则具有更高的特异性,而基于随机森林法的混合资料预测模型其预测效果最佳。  结论:本文建立的基于分子标志物的预测模型能够达到以少量基因预测复杂疾病的目的;基因表达及临床信息混合预测模型相较于基因模型及临床变量模型具有更佳的预测性能。本文建立的基于生物信息学方法识别和预测复杂疾病的研究模型具有可推广性。
其他文献
鸡传染性贫血病是由鸡传染性贫血病毒所导致的再生障碍性贫血,并且会出现全身性淋巴组织萎缩的一种免疫抑制性疾病.这种病通常会伴随着并发和继发病毒,同时会造成细菌和真菌
无线传感器网络是由大量微型传感器节点组成的无线自组织网络系统。由于无线传感器网络的主要任务是进行数据的采集和发送,节点通常采用的都是计算能力受限的低功耗芯片,不适
目的:通过制作高脂血症、Ⅱ型糖尿病并发高脂血症、IgA肾病并发高脂血症大鼠模型,采用Realtime PCR(SYBR GreenⅠ)检测血管生成素样蛋白3(angiopoietin-related protein 3,AN
本文主要研究了高速环境下宽带无线信道的信道模型和测量数据处理方法的改进。作为无线信道建模的基础理论,同时也是无线系统设计的理论基础,本文从平均传播损耗、宏观衰落、
摘要:自主学习是认知的前提,在学习英语方面,高中学生通过教师科学系统的训练和培养,最终可以独立地阅读英语学习材料,理解文章,构建出自己的学习模式和知识体系,并且将此能力运用到课外阅读和其他学科中,由此看来,对于学生自主学习能力的培养是相当重要的。  关键词:自主学习;高中英语;阅读教学  中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2017)11-0048  《英语课程
矿山地质灾害是矿山企业面临的重大问题,也是关系到社会和国民经济可持续发展的重大问题,但我国在矿山安全预报等高新技术领域的研究几乎是空白,目前现状仍是事故后报警,而不是事