论文部分内容阅读
研究目的: 混合表型急性白血病(Mixed-phenotype acute leukemia, MPAL),是指在形态学或者免疫学检测中,可见明显的具有不同表型的两群白血病细胞,或者一种白血病细胞表达两种或两种以上细胞的表面标志。MPAL发病率低,占所有白血病的2-4%,而费城染色体(Philadelphia chromosome,Ph)阳性的MPAL,是具有Ph或者BCR-ABL1的MPAL,因其发病率更低,且预后差,故关于此类白血病的报道不多。 二代测序技术,包括全基因组测序(Whole Genomic Sequecing,WGS)及转录组测序(RNA Seq)等,是近年来出现且正在日趋取代基因芯片技术的一种新型高通量数据检测方法。通过该技术的应用,我们可以全面了解基因组DNA和转录组RNA在细胞特定发育阶段的分布及演变,不但可以对机体的发育过程进行研究,同时适用于对肿瘤发生发展的基因表达研究,这对揭示肿瘤的发病机制有着非常重要的作用。 到目前为止,还没有应用二代测序技术对Ph+ MPAL白血病进行研究的报道。我们应用WGS及RNA Seq技术,对我中心的一例同时具有B淋巴细胞/髓细胞表型的Ph+ MPAL患者,结合治疗时间及疾病状态纵向选取10个时间点骨髓样本,进行了深入的测序研究。 研究方法: (1)整理一例Ph+ MPAL患者的临床信息,收集初发、部分血液学缓解、完全血液学缓解、完全细胞遗传学缓解、完全分子生物学缓解、复发等10个时间点骨髓样本及口腔黏膜样本,选取初发、完全细胞遗传学缓解及口腔黏膜样本进行WGS,10个纵向时间点样本进行RNA Seq。对于测序数据,我们应用生物信息学方法挖掘患者分别在DNA和RNA水平上的遗传变异,识别与Ph+ MPAL发生发展密切相关的显著突变基因和差异表达基因,并对这些基因进行功能富集分析。另外,我们采用实时定量PCR技术验证上述分析得到的基因表达拷贝情况,采用PCR sanger测序验证检测到的基因位点的突变; (2) GEO(Gene Expression Omnibus)数据库中检索Ph+的配对白血病研究数据,筛选Ph+ CML、Ph+ ALL、Ph-ALL以及Ph-AML的基因芯片数据和RNA Seq数据并下载,将数据整合标准化后,比较分析Ph相关白血病样本与本研究中Ph+ MPAL患者的基因表达差异及信号通路富集情况; (3)应用GSEA(Gene set enrichment analysis)软件分析AML的研究数据中健康人骨髓与外周血,健康人骨髓与CD34+的骨髓干细胞间的基因表达差异,并进行各个数据间的差异表达基因的功能富集分析; (4)应用在线分析软件String进行差异表达基因分子相互作用网络预测。 研究结果: (1)WGS分析SNV(single nuclear variation)发现,初发骨髓中共4469个突变,其中发生在基因间(intergenic)的突变有2599个,内含子(intronic)1459个,非编码RNA(nc RNA)286个,基因组上游(upstream)37个,外显子(exonic)36个,非翻译区(UTR)区28个,基因组下游(downstream)24个。突变频率C>T29.98%,T>C21.95%,T>G16.35%,C>A13.76%,T>A11.30%, C>G6.66%; (2)WGS分析CNV(copy number variation),在整个基因组组织分布和染色体臂水平,初发白血病样本均未见到明显的拷贝数扩增,相反,在多个染色体上,发现了拷贝数的丢失。鉴定出448个拷贝数显著变化的区域,包括染色体2、7、9、13、14、22等区域的显著缺失; (3)WGS分析SV(structure variation),我们发现了1035次结构变异事件,大片段的拷贝数缺失(deletion)390次,大片断的拷贝数扩增(duplication)58次,倒位(inversion)1次,异位(translocation)586次。结构变异断点(breakpoint)所在位置主要位于基因间区域,其次为内含子区,其中有明确基因注释的易位47个。另外,我们检测到了9号染色体和22染色体间的易位,9号染色体断裂点位于Chr9:133724225(ABL1外显子1a),而22号染色体位于Chr22:23632040(BCR内含字13)。和临床检验结果一致; (4) RNA Seq分析基因表达差异:A.10个时间点样本的差异表达基因(两样本间差异变化作为唯一条件,q<0.05)共85个,我们可以看到,部分基因如ARPP21、CYP19A1、MUC4、等在初发时显著高表达,化疗后迅速下降,并持续呈低水平状态,而复发后再次升高,这些因子可以作为潜在的Ph+MPAL筛选指标,并用于评估治疗的疗效。而IL7R、TFRC、ANK1、等在白血病初发时为显著低表达,治疗后增高不明显,但加用TKI后明显增高,考虑这些基因为Ph的靶基因。TFR2、B9D1、HOXA5等在治疗前显著低表达,而化疗后逐渐增加,而趋于平稳,复发后再次降低,提示这些基因参与正常的骨髓功能。B.对85个差异表达基因的功能分析,发现这些基因所富集的信号通路共26个(p≤0.05),其中最主要的信号通路包括免疫系统进程、造血细胞发育、细胞分化、蛋白结合、信号转导活性以及白细胞淋巴细胞的活化等。这些结果都提示白血病的发生与这些信号通路密切相关; (5) RNA Seq分析融合基因,转录区域只发现一个融合基因BCR-ABL1,且融合位置为e13a2,和PCR结果及WGS分析结果一致; (6) q-PCR验证基因表达,符合率达100%,sanger测序验证基因突变结果显示符合率达100%,分析结果准确,可信; (7)在GEO中检索与Ph相关的白血病配对研究,筛选出三个与本研究相近的基因芯片数据,包括Ph+ CML,Ph+/Ph-ALL,以及Ph-AML; (8)分析发现,完全细胞遗传学缓解的(CCR) Ph+ MPAL骨髓样本(20130618)和健康人骨髓的基因表达基本一致,验证了我们治疗的有效性; (9)在与其他白血病数据分析中发现,Ph+ MPAL的基因表达和其他类型的白血病均不同,而和Ph-AML差异基因在功能上相似; (10)分析AML数据发现,HIST2H2BE、HIST1H2BH、HIST1H3D和HIST1H2BC,在所有AML中均显著高表达,相反,T细胞受体信号通路、NK细胞介导的细胞毒作用、趋化因子信号通路等与AML均呈负相关; (11)应用String对共表达的26个差异基因分析发现,这些基因参与调节多个信号通路,包括Hedgehog(GLI2)、造血干细胞谱系发育(EPOR、TFRC)、自噬(IGF2)、Jak-STAT(EPOR)、mTOR(TFRC)、胚胎发育以及DNA复制的调控等。 研究结论: (1)利用WGS及RNA Seq筛选出与Ph+ MPAL相关的各类遗传变异,同时在基因组水平和RNA水平上验证了Ph染色体的存在,并证明BCR断裂点位于BCR第13号内含子,与PCR结果一致。q-PCR技术及PCR sanger测序技术验证了基因表达及点突变,证明数据分析可信; (2)10个时间点骨髓样本的测序分析,筛选出与Ph+ MPAL显著相关基因85个,发现多个基因集功能与白血病的发生密切相关,包括免疫系统进程、造血细胞发育、细胞分化、蛋白结合、信号转导以及白细胞/淋巴细胞的活化等。其中,MME、ZNF423等基因,对Ph+ MPAL白血病的筛查及治疗疗效评估具有潜在应用价值; (3)通过基因差异表达对比分析,验证了Ph+ MPAL与其他Ph+白血病的基因表达完全不同,但差异表达基因在功能上和AML更相似; (4)应用String对Ph+ MPAL、Ph+/Ph-ALL、Ph+ CML和Ph-AML共表达的26个差异基因分析提示,JAK2及ERBB激酶活性的变化对白血病的发病至关重要。