基于多组学数据的癌症诊断及预后标志物识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:eaglesword
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是我国居民死亡的主要原因之一,癌症普遍具有早期诊断困难、预后差和容易复发的特点。当前,虽然已经开发出多种癌症治疗手段,但癌症的死亡率依然居高不下。对癌症发生机制的研究是寻找更好治疗方法的关键,其中癌症相关生物标志物的识别可以更好的推进癌症早期筛查及分子靶向药物的研发。因此,本论文以癌症为研究对象,整合mRNA表达、DNA甲基化、拷贝数变异、体细胞突变、miRNA表达和lncRNA表达等多种组学数据,构建生物信息学方法识别癌症诊断及预后生物标志物。本论文的主要研究内容包括如下四个方面:1)甲基化的异常会导致基因的不稳定,从而引发癌症,lncRNA也已经被证实与癌症有密切关系。本论文以lncRNA基因的甲基化变化为主要依据,整合lncRNA基因的甲基化、lncRNA表达及mRNA表达数据,首先识别差异甲基化的lncRNA,随后在生存相关、甲基化变化与表达变化负相关、ceRNA等层面进一步筛选lncRNA,得到lncRNA诊断生物标志物。最终,得到10个癌症共计29个癌症特异的lncRNA诊断标志物及2个多种癌症共有的lncRNA诊断标志物HOXA-AS2和AC007228。甲基化相关lncRNA诊断标志物的识别可以为癌症诊断的准确性提供更多保证。2)癌症的发生是多基因的失调引起的,为了寻找多基因协同的模式,本论文提出multi-DBnet方法,整合mRNA表达、拷贝数变异、体细胞突变、miRNA表达及lncRNA表达数据以网络的形式对基因进行研究,识别网络中的关键基因模块。对每个基因构建回归模型,并利用自适应Lasso进行模型训练,识别突变及非突变情况下调控因子变化的失调基因。将失调基因投入到蛋白质互作网络中计算失调基因间相关关系的大小,识别失调基因模块。基于此,本论文识别出一个10基因模块(APC、TSC2、CTNNB1、RB1、EPB41L3、AXIN1、CAND1、BAP1、GPR63和CARD11)可以作为肝细胞癌的诊断标志物。并识别出PBRM1、RB1、NF1、OBSCN、TP53、CDKN2A、PTEN、NIPBL、SMAD4、BAP1和PARD3在四个以上的癌症中失调。多基因诊断标志物与免疫组化和基因检测等方法相结合,可以提高癌症的鉴别准确性,助力癌症的精准医疗。3)癌症预后标志物的识别可以帮助筛选需要加强监测或辅助治疗的患者,干预不良的自然预后。本论文整合DNA甲基化、mRNA表达、拷贝数变异和miRNA表达数据,提出癌症预后标志物识别方法:multi-PB。应用该方法为13种癌症分别识别出10基因预后生物标志物,并找到了与多种癌症生存相关的基因,SLK、ZRANB1、BTBD2、PTAR1、VPS37A、EIF2B1和API5。随后,将结果与其他方法对比,multi-PB的C-index明显优于其他几种同样整合多组学数据的方法。Multi-PB可以更准确的识别预后生物标志物,识别到的标志物可以帮助预测患者的预后状态,尽早对不良自然预后的患者进行干预。4)癌症患者的预后预测可以更好的帮助患者选择适合的治疗策略,为了构建更准确的患者预后生存预测模型,本论文整合mRNA表达、DNA甲基化、拷贝数变异、miRNA表达及lncRNA表达数据,提出患者预后预测方法:multiSP,用基于递归特征消除的支持向量机的策略筛选特征,随后利用图卷积网络训练分类模型,并用视图关联发现网络整合分类结果,得到患者最终的预测预后分类。在分类的过程中,分别评估了以一年、三年和五年生存期分类的预测准确性,结果表明,各组学数据中选择的特征都与肝细胞癌密切相关,该预测模型在五年为分类标准时效果最好(~0.967)。随后,将方法推广到肾透明细胞癌中。Multi-SP利用深度学习方法构建预测模型,相较于其他机器学习方法可以更准确的预测患者预后状态,尤其是可以更准确的预测患者的5年生存状态。综上所述,本论文整合多组学数据进行癌症诊断及预后标志物研究,识别出了癌症诊断及预后相关分子及多分子模块、构建了患者生存预测模型,并为各癌症识别出特异的及癌症共有的生物标志物,这些识别出的生物标志物可以作为癌症筛查和靶向药物实验中的候选分子。与前人方法相比,本论文提出的multi-DBnet、multi-PB和multi-SP方法,均可以应用到多种类型的癌症中,其结果可以为癌症的诊断、治疗及发病机制的研究提供帮助。
其他文献
胰腺癌(pancreatic ductal adenocarcinoma,PDAC)是一种恶性程度极高的消化系统肿瘤,其平均5年生存率低于8%。由于其早期的解剖部位隐匿、临床症状不典型、肿瘤标志物特异性不高等问题,早期诊断极为困难,大多数胰腺癌患者确诊时已属晚期,不适合进行手术切除。化疗是其治疗的首选治疗手段,其中吉西他滨是胰腺癌的的一线治疗药物,但胰腺癌患者往往会对吉西他滨产生耐药,最终导致化疗
学位
镉(Cd)因其高迁移性、持久性和植物毒性,含Cd土壤污染及其对人类健康的危害已成为全球严重的环境问题。植物萃取技术可用于解决我国大面积分布Cd污染问题,然而超积累植物在环境中定植、生长和提取功能的发挥都受到Cd胁迫的显著影响。丛枝菌根真菌(Arbuscular mycorrhizal fungi,AMF)和蚯蚓(Earthworm,E)是土壤生态系统中不同营养级的典型代表,在改善植物生理生化特性、
学位
面向污水处理“碳中和”运行,以“碳源捕获及改向”为理念的新型污水有机质吸附/生物降解工艺(即A/B工艺)被认为是污水能源资源回收利用的发展方向。在A端最大程度上捕获分离污水中有机碳源进行厌氧消化产能,在B端实现污水高效脱氮。然而新型A/B工艺面临着常规污水碳源捕获技术难以适应我国低有机负荷的污水水质特征,低碳氮比出水难以通过常规脱氮途径有效脱氮,以及碳源捕获后污泥厌氧消化产甲烷效能不明确等问题,因
学位
交际语境写作是在特定的交际情境中,为了交流、表达需要进行的双向互动语言实践,写作时的话题、角色、读者、目的等语境要素决定着语篇的内容和形式,它解决了传统习作教学中写作动机缺失、内容匮乏等一系列重要问题。统编版小学《语文》五年级(上册)第六单元《我想对您说》以“给父母写信”为主题,教师可尝试交际语境下的习作教学思路,构建由“对话”“读者”“作者”“目的”“语言”等交际语境要素组成的习作课堂,让学生通
期刊
城市污水处理厂二级出水中残留的磷会影响受纳水体的营养水平进而破坏水生生态系统平衡,残留的微污染物会对水环境安全及人体健康产生潜在威胁。目前,混凝工艺是应用最为普遍的污水深度处理技术,但其在实际运行中存在絮体沉降慢和污染物去除能力不足等现实问题。针对磷酸盐和微污染物的定向去除,本研究分别制备载镧钴铁氧体和磁性活性炭等铁氧体基磁性材料,并将其用作新型磁种,构建磁介体加载混凝工艺(MSC),将吸附、混凝
学位
肝癌是最常见的恶性肿瘤类型之一,其高转移、高复发的特性,造成肝癌中晚期患者极高的致死率。有研究表明,肝癌细胞表面糖链末端的唾液酸修饰水平会发生显著提升。唾液酸是一种常见的九碳糖,在多种类型的肿瘤中,唾液酸的含量、连接方式等都会发生各种不同程度的改变,而肿瘤细胞的这种唾液酸化状态的改变,可以进一步引起细胞迁移运动能力、与血管内皮结合能力等细胞特性的改变,从而促进转移瘤形成,导致预后变差。唾液酸含量在
学位
目的 探究奥曲肽联合泮托拉唑治疗急性上消化道出血临床疗效及对患者炎症和应激指标的影响。方法 选取上消化道出血患者80例,随机分为对照组和观察组,各40例。对照组患者采用泮托拉唑治疗,观察组患者采用奥曲肽联合泮托拉唑治疗,两组患者连续治疗3 d。结果 治疗3 d后,两组患者血清TNF-α、IL-6、hs-CRP均较治疗前下降,且观察组低于对照组(P<0.05);两组患者MAD、ADH、COR均较治疗
期刊
p53是最重要的抑癌基因之一,参与调控肿瘤发生、发展过程中的多种细胞学事件,一直是肿瘤学研究的热点分子。作为“基因守卫者”,p53主要通过其转录因子活性激活或抑制一系列下游靶基因的表达来发挥其生物学功能。因此,筛选p53新的靶基因并研究其作用对于全面理解p53的功能体系有着非常重要的意义。另外,约有50%的肿瘤中p53发生突变,其余p53未突变的肿瘤中,p53信号通路往往被抑制或失活。因此,阐明调
学位
结构完整性管理是为保证工程结构在全寿命过程中能够持续地满足其功能要求的动态决策过程。对于海洋工程结构来说,在服役周期内满足既定要求下安全、经济且稳定地运行是其首要的功能要求。但由于建造材料、服役环境、荷载作用存在着大量的不确定性,导致海洋工程结构的运营风险巨大。因此依据其自身特性制定合理的运维方案来降低其全寿命周期的运营风险是十分重要的。观测运营过程中有关于海洋工程结构的相关数据,有助于减少运营过
学位
水泥基材料脆性大、原生缺陷多,在使用过程中不可避免地会产生微裂纹,形成侵蚀性离子扩散通道,加速水泥基材料劣化或钢筋锈蚀。在水泥基材料中引入超吸水聚合物可实现裂缝的快速闭合,阻挡有害离子的侵入,但其引入的大孔对水泥基材料力学性能的降低制约了其在水泥基材料的应用,而超吸水聚合物的尺寸,溶胀性能及其影响区域是其影响力学性能的主要因素。海藻酸钙凝胶是一种具有低溶胀率的性能可控的吸水性材料,其对水泥基材料的
学位