论文部分内容阅读
许多研究者试图通过比较癌症患者外周全血与正常对照组的mRNA表达谱,寻找可以作为癌症预防、早期诊断或治疗的标记物。然而,鲜有工作评价在癌症患者外周全血和正常对照组之间发现的差异mRNA信号是否可在不同的研究中重复。同时,由于在外周全血中的RNA主要来自各种白细胞,从癌症外周全血中检测到的mRNA差异信号可能反映某些白细胞在机体癌症状态下发生的改变,也可能反映癌症患者外周血白细胞构成比例的变化。在不确定外周全血mRNA差异信号来源的情况下,许多研究者仍利用通路富集分析来解释癌症外周全血差异表达基因的生物学功能,其含义是模糊不清的。因此,本论文首先分析在同一种癌症的不同独立基因表达谱数据中识别的mRNA差异信号是否具有显著的可重复性,然后分析外周血白细胞构成比例改变对癌症外周全血差异mRNA信号的影响,最后利用差异上、下调基因分开进行通路富集的分析策略对癌症外周全血差异表达基因进行了功能分析和含义解读。在第二章中,我们以肺癌为例,展示了从三套独立的肺癌外周全血基因表达谱中分别识别的差异表达基因具有显著的可重复性。然后,通过估计每个样本的白细胞比例,展示了在癌症条件下外周血白细胞构成比例的变化特点,即髓系细胞比例倾向于增加而淋巴系细胞比例倾向于降低。通过筛选髓系细胞相对淋巴系细胞的差异表达基因,并与肺癌相对正常对照组的差异表达基因比较,发现肺癌外周全血mRNA差异信号主要受髓系和淋巴系细胞的比例变化影响,主要反映髓系细胞和淋巴系细胞之间的表达差异信号。通过对肺炎、肺结核和结节病三种肺部炎症疾病表达谱进行类似分析,我们发现肺部炎症疾病外周全血mRNA差异信号也来自髓系细胞比例增加、淋巴系细胞比例降低的白细胞构成比例变化,反映髓系细胞和淋巴系细胞间的差异信号。通过直接比较肺癌和肺部炎症疾病分别相对正常对照组的差异表达基因,发现两者交叠的基因在表达调控方向上100%一致,提示肺癌和肺部炎症疾病的外周全血差异mRNA是高度相似的。因此,通过识别癌症相对正常对照组的差异表达mRNA信号对寻找有临床实践意义的炎、癌鉴别生物标记物的意义十分有限。在第三章中,我们总结了功能富集分析的两种策略,并通过分析由基因芯片和RNA-seq两种技术检测的五种癌症的表达谱数据证明了将差异上、下调基因分开富集的策略比合并差异上、下调基因的策略具有更高的统计效能。在第四章中,我们首先展示除了肺癌之外,结肠癌的外周全血mRNA差异信号也主要来自白细胞的群体构成变化。据此,我们推测不同癌症外周全血中观察到的mRNA信号扰动都和白细胞构成改变相关。利用将差异上、下调基因分开富集的策略,识别了肺癌、结肠癌、乳腺癌和卵巢癌四种癌症外周全血差异表达基因共同扰动的通路,发现这些通路都富集了髓系和淋巴系细胞之间的差异表达基因,进一步表明癌症外周全血中的功能信号主要反映白细胞群体数目的改变,而较难反映某种白细胞的功能异常。因此,基于人类外周全血基因表达谱寻找临床可应用的癌、炎鉴别标记物时,必须排除白细胞比例构成改变的影响,集中于直接比较癌、炎外周全血的基因表达谱,或寻找某些特定白细胞中可能存在的分子标志。