论文部分内容阅读
结直肠癌是全球主要致死性恶性肿瘤之一,构建适用于复杂临床背景的结直肠癌早期诊断、复发相关的分子标志具有重要意义。为获得可靠的研究结果,众多研究通常要求使用高质量的临床样本进行高通量测序分析,如高肿瘤纯度的新鲜冷冻样本等,本文将这些样本定义为科研样本。而对于广泛存在于临床或组织样本库且具备患者完善的病理信息和随访数据的非科研样本,如石蜡包埋样本或活检微量样本等,受其低质量影响,难以获得精细可靠的基因表达定量信息,通常不建议对其进行高通量检测。我们前期研究发现,基于样本内基因表达相对大小关系(Relative expression orderings,REO)的定性特征对低质量RNA样品不敏感。因此,在本研究中,通过对收集的45例经石蜡包埋处理、肿瘤纯度未知、随访时间约6年的II期结直肠癌样本进行高通量测序,我们论证了在低质量临床非科研样本中基于REO定性特征开发分子标志物的可行性,构建了结直肠癌早期诊断、复发相关的两组基因标志,并进一步分析了结直肠癌复发转移相关的转录组特征。这为有效利用低质量非科研样本以及了解结直肠癌复发转移相关的分子发生机制提供了新的方法和思路。1.自测临床非科研样本质量分析及基于REO定性特征的癌特性评估首先,通过与来自TCGA(The Cancer Genome Atlas)数据库的231例II期结直肠癌新鲜冷冻样本的基因表达谱数据进行对比,我们发现,45例自测临床非科研样本中的RNA发生严重降解片段化,基因表达检测值的“精确性”被严重影响,部分基因表达检测值甚至变为0值。随后,基于REO定性特征,在77例II期结直肠癌与51例癌旁正常两组新鲜冷冻样本间,分别筛选到177122对和43439977对REO模式在癌组织相对于癌旁正常组织发生高度稳定逆转和显著逆转的癌特性基因对,并将其作为参考标准评估45例自测样本中基于REO定性特征的癌特性保持情况。结果显示,与新鲜冷冻癌样本中95%的高度稳定逆转基因对和约60%的显著逆转基因对的REO模式得以保持相比,自测临床非科研样本中癌特性基因对的保持率分别约为80%和55%。该结果表明,大多数基于REO定性特征的癌特性在低质量临床非科研样本中稳健保持。2.适用于临床非科研样本的结直肠癌早期诊断标志结直肠癌患者早期及时发现具有重要临床意义,但大多数患者被确诊时已处于中晚期。因此,亟需开发稳健的结直肠癌早期诊断分子标志。已报道的由7个基因对组成的结直肠癌早期诊断标志,只能准确识别31.11%的自测样本,其预测效能在临床非科研样本中被严重削弱。在本研究中,我们构建了一组由136个基因对组成的结直肠癌早期诊断标志,该标志对720例结直肠癌样本和502例非癌样本(包括结直肠正常样本与肠部炎性疾病样本)的敏感性与特异性分别为98.19%和99.60%;其中对45例自测临床非科研样本的识别准确率为95.56%。以上结果表明,即使在低质量临床非科研样本中,由相对较多基因对(136个基因对)构成的预测标志仍可以对结直肠癌患者进行稳健可靠的早期诊断。3.适用于临床非科研样本的II-III期结直肠癌患者术后复发风险预测标志据报道,约25-30%的II期结直肠癌患者在术后发生复发转移。然而,基于目前临床病理指标不能充分准确评估II-III期结直肠癌患者的术后复发风险,因此,亟需开发可对其进行稳键预测的分子标志。在本研究中,我们基于REO定性特征,开发了一组由4500个基因对构成的II-III期结直肠癌患者术后复发风险预测标志。与已报道的44基因对标志在45例自测临床非科研样本中的预测效能相比(仅识别出25%的非复发样本),该基因标志可以将患者分为术后无病生存时间存在显著差异的两组,且能准确识别71.42%的术后复发样本(21例)和70.83%的术后非复发样本(24例)。该结果进一步证实,由相对较多基因对构成的预测标志可稳健应用于低质量临床非科研样本中。4.结直肠癌复发与远端肝转移转录组特征分析分别在TCGA数据库中结直肠癌I和IV期两组样本、II-III期患者术后高、低复发风险两组样本以及自测II期复发与非复发两组样本间,筛选差异表达基因,并对可被重复检测的差异表达基因进行基因功能和调控关系分析,发现这些基因主要富集于免疫功能相关的通路中,这表明II-III期结直肠癌患者术后复发与免疫功能失调存在密切关联。此外,通过对结直肠组织样本(包括非复发转移结直肠癌样本和结直肠正常样本)和肝组织样本(包括肝癌样本和肝正常样本)的基因表达谱数据进行分析,筛选到12个在肝组织中存在表达但在结直肠组织中不表达的“肝组织特异性表达基因”。其中,两个“肝组织特异性表达基因”(ANGPTL3和CFHR5)在经微切割处理的非复发转移结直肠癌样本中不表达,却在经微切割处理的结直肠癌肝转移灶和对应原发灶样本中均存在表达(Fisher’s exact test,p<0.05)。并且,与这两个基因存在共表达的基因显著富集于“Starch and sucrose metabolism”和“Drug metabolism-cytochrome P450”等“肝样”代谢通路中。该结果暗示,结直肠癌原发灶和同步肝转移灶中的肿瘤细胞可能均表达某些“肝组织特异性表达基因”,以便于更好的侵袭浸润和适应肝组织微环境。