论文部分内容阅读
背景:乳腺癌是严重危害全世界妇女健康的癌症之一。日前世卫组织宣布,2020年确诊癌症的患者数达1930万人,1000万人死于癌症。目前,全球五分之一的人在其一生中都会罹患癌症,并且乳腺癌因在新增癌症病例中数量达到120多万例、占比11.7%而成为最常见癌症。乳腺癌的发病机制常常是多种因素共同作用的结果,这其中多基因是一个重要并且关键的因素。因此,对乳腺癌相关基因的深入研究不仅需要从不同水平进行表达量分析,还需要结合大量的组学信息,从而深入并且全面地研究某个基因在乳腺癌的发生发展中的作用,继而对乳腺癌的早期诊断以及早期治疗可能带来的重大意义。生物信息学技术通过收集并且筛选生物学数据、编辑、整理及利用生物大数据的一门新兴学科,它融合了分子生物学、统计学、医学信息学以及计算机科学等众多学科为一体并相互之间高度渗透。例如根据核酸测序的技术从而来预测疾病的发生发展;根据DNA序列来预测蛋白质序列以及其功能等。而如果生物信息学技术结合了基因芯片技术来深入研究肿瘤发病的相关基因及其调控方式,更体现了对肿瘤基因表达调控机制研究的整体性、系统性,虽然目前这种推测无法实现高精准度,但它就像一盏启明灯,照亮我们进一步实验研究的方向。随着不同高通量技术在医学生物学中的应用,影像组学也应运而生。影像基因组学是一门研究影像学表型和肿瘤基因组之间相关关系的新兴学科。通过影像组学数据与分子组学数据之间的交互融合,不仅建立起了分子与影像之间的联系,同时也建立起了宏观与微观之间的联系。癌症影像数据库(The Cancer Imaging Archive,TCIA),正是实现上述关联的重要并且可靠的资源。而如果通过癌症影像数据库这一资源实现宏观影像特征与微观分子之间建立联系,也必将使肿瘤的靶向治疗迈入一个新的台阶。目的:本研究旨在利用多组学信息,探究组织非特异性碱性磷酸酶(Tissue NonSpecial Alkaline Phosphatase,ALPL)基因在乳腺癌发生过程中可能的作用,揭示ALPL与乳腺癌钙化征的关系,为乳腺癌发病机制的探索提供一条新的思路,并为乳腺癌的精准分子诊断和靶向治疗奠定一定的基础。方法与结果:本研究首先通过大型肿瘤数据库—Oncomine下载ALPL基因在各种不同肿瘤组织以及乳腺癌组织中的表达差异情况,继而通过肿瘤细胞系数据库—CCLE加以证实,发现ALPL基因在乳腺癌病例和正常人群中表达差异显著。接着,我们结合生物信息学工具GSEA软件和数据挖掘方法对ALPL基因以及与之发生相互作用的基因集合进行富集分析,以此来预测ALPL基因参与发病的信号通路,从而预测其在乳腺癌发生过程中的可能作用。此外,我们利用人类蛋白质图谱数据库—HPA从蛋白水平探索ALPL在乳腺癌中的差异表达情况,并通过免疫组化实验加以验证,继而通过Targetscan数据库以及Lnc Base两个数据库来探索其发病机制,并结合文献加以证实,此外,我们还运用了String蛋白质数据库进一步分析了ALPL蛋白以及与之相互作用蛋白,揭示ALPL与乳腺癌钙化征的关系。我们通过对146例乳腺癌患者的ALPL表达情况的免疫组化实验验证发现乳腺癌患者在ALPL表达情况方面较癌旁正常组织的ALPL的表达情况明显升高,并且我们通过分析ALPL表达水平与Her-2阳性的关系发现二者具有明显相关性。此外,我们还将99例乳腺癌影像分为高表达ALPL组(50例)和低表达ALPL组(49例),利用3D-Slicer进行图像特征分析,建立了判断ALPL表达的决策树、极端梯度提升、支持向量机和神经网络四种机器学习算法模型,并进行了混淆矩阵和受试者特征曲线(ROC)验证。而且我们发现ALPL基因表达与影像组学特征参数联合,可以提高影像组学判断乳腺癌CD8A基因表达状态的能力。结论:本研究运用了多组学全面的分析及预测了ALPL基因在乳腺癌发生过程中的作用,结合已发表的研究,ALPL过表达的乳腺癌病例中,碱性磷酸脂酶活性升高,可能与乳腺癌钙化征有着紧密的联系,并且此联系可能与Her-2过表达有关。鉴于钙化征与乳腺癌预后密切相关,ALPL很有可能作为高效的乳腺癌预后生物标志物。影像组学有判断乳腺癌基因表达状态和肿瘤分子亚型的潜力。后续我们将通过扩大病例量,深入研究ALPL联合影像基因组学对乳腺癌进行诊断和分型的效果,从而与其他乳腺癌分子标志物一起组成分子标志物网络。