论文部分内容阅读
目的:子宫内膜癌(endometrial carcinoma,EC)是美国最常见的女性生殖器官癌症,全球发病率仅次于宫颈癌。有肥胖,糖尿病,高血压,接受雌激素/他莫昔芬疗法或遗传性Lynch综合征等问题的妇女患内膜癌的风险相对更高。子宫内膜癌最常见的临床表现是子宫异常出血,但这一症状也可由许多其他疾病引起。在某些情况下,子宫内膜癌可能达到晚期,才出现相关体征和症状。尽管肿瘤标志物CA125有助于内膜癌的检测,主要在II型内膜癌或晚期癌症中其浓度比早期癌症较高,但其正常值并不排除更晚期的肿瘤。伴随远处转移的子宫内膜癌患者的5年生存率下降至17%。因此,迫切需要发现潜在的早期诊断和预后生物标记物,以供临床医生采用适当治疗方法时参考。基因表达综合(GEO,gene expression omnibus)是一个庞大的公共基因表达数据储存库,储存各种肿瘤基因表达谱数据集的资源。癌症基因组图谱(TCGA,The Cancer Genome Atlas)是一项人类癌症基因组计划,已对多种原发癌进行了测序和分子鉴定。目前已包含基因组,表观基因组,转录组和蛋白质组学数据。本研究的目的是在分析GEO和TCGA两大数据库的子宫内膜癌数据集的共同差异表达基因的基础上,利用生物信息学方法鉴定关键基因网络模块,挑选具有预后价值的关键基因进行蛋白组学验证,并在子宫内膜癌细胞中进行分子生物学实验并探究相关分子机制。本研究将为子宫内膜癌的分子诊断与精准治疗和预后预测提供新的角度和理论基础。研究方法:1、Limma R包用于筛选GEO数据集(即GSE63678,GSE17025)中内膜癌与正常内膜的差异表达基因(差异表达认定标准:P值<0.05 and差异变化倍数>2倍),利用Deseq2 R包筛选TCGA子宫内膜癌队列中内膜癌与癌旁的差异表达基因(差异表达认定标准同上),并用ggplot2 R包可视化。将上述三个数据集中筛选出的差异表达基因用Venn图以取出交集即共同差异表达基因。2、利用pheatmap R包将筛选出的共同差异表达基因在各数据集中的表达情况绘制成聚类热图。3、利用cluster Profiler R包对共同差异表达基因进行GO(gene ontology)基因功能及KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析。4、利用String数据库建立共同DEGs的蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络,Cytoscape中的MCODE(Molecular Complex Detection)插件鉴定母网络中起关键作用的子网络基因模块。5、筛选子网络基因模块中度数值(degree)靠前的前20个基因,利用Survminer R包分析其表达水平对内膜癌患者的预后影响。6、根据生存分析结果,选择关键基因UBE2C(Ubiquitin Conjugating Enzyme E2 C)在TCGA子宫内膜癌队列中进行m RNA水平的验证,利用单变量logistic回归分析其表达水平与与患者临床病理参数的关系。7、应用免疫组织化学方法检测我院72例子宫内膜癌恶性肿瘤、23例子宫内膜不典型增生和34例正常内膜组织中UBE2C的蛋白表达水平,然后探究其对内膜癌患者各项临床病理特征及生存结局的影响。8、选取两种内膜癌细胞系ISHIKAWA和HEC-1-B进行后续细胞生物实验。利用RNA干扰技术抑制内膜癌细胞系ISHIKAWA和HEC-1-B中UBE2C的表达。利用MTT、划痕实验、Transwell、Annexin V–PI双染法、细胞周期检测法等检测了干扰UBE2C后各组内膜癌细胞增殖、迁移、侵袭、凋亡能力及细胞周期的改变。Western blot技术检测了si-RNA转染内膜癌细胞后PI3K/Akt信号通路节点蛋白PI3K、p-PI3K、Akt、p-Akt的蛋白表达变化,同时检测了抑癌基因TP53蛋白的表达变化。结果:1、综合GEO和TCGA数据库的分析结果,Venn图显示总共筛选出来的344个共同DEGs,其中上调170个,下调174个。2、聚类热图显示筛选出的共同DEGs可以将肿瘤样本与正常样本较好地区分为两类。3、共同上调的DEGs主要富集在有丝分裂核分裂(GO:BP),纺锤体(GO:CC)和微管结合(GO:MF)中(p均小于0.05)。而下调的共同差异表达基因则主要富集在发育生长的正向调控(GO:BP),细胞外基质(GO:CC),和钙离子通道活性(GO:MF)中(p均小于0.05)。4、共同上调的DEGs主要集中于细胞周期(hsa04110),卵母细胞减数分裂(hsa04114),细胞衰老(hsa04218),碳代谢(hsa01200),p53信号传导途径(hsa04115)等通路(p均小于0.05)。共同下调的差异表达基因主要集中于EGFR酪氨酸激酶抑制剂抵抗(hsa01521),JAK-STAT信号传导途径(hsa04630),钙信号传导途径(hsa04020),黑素瘤(hsa05218),癌症中的Micro RNA(hsa05206)等通路(p均小于0.05)。5、由共同差异表达基因构建的PPI网络有284个节点和3697个边。MCODE插件识别出母网络中起关键作用的子网络模块,该模块有76个节点和2677个边。6、子网络模块中的关键基因CCNB2,CDC20,BUB1B,UBE2C,AURKB,FOXM1,NCAPG,RRM2,TPX2,DLGAP5,CDCA8,CDC45,MKI67,BUB1,KIF2C的异常高表达与EC患者不良预后相关(p<0.05)。7、单因素Logistic回归显示,在TCGA子宫内膜癌队列中,UBE2C的高表达水平与FIGO晚期(IV期vs.I期,OR=3.152),低分化(低分化vs.高分化,OR=7.578),病理组织学分型(浆液性子宫内膜癌vs.子宫内膜样腺癌,OR=4.813),远处转移(有远处转移vs无远处转移,OR=4.043),带瘤状态(带瘤状态与无瘤状态,OR=2.548)等多个不良临床病理学特征显著相关(所有p值均<0.05)。8、免疫组化结果显示UBE2C主要定位于内膜癌组织中的胞浆和胞膜中,细胞核也有少量表达。UBE2C在内膜癌中表达的阳性率(88.89%)明显高于子宫内膜非典型增生(60.87%)和正常子宫内膜组织(35.29%)(P均<0.05)。UBE2C高表达与FIGO晚期和内膜癌患者淋巴结转移状态明显相关(p<0.05)。Kaplan-Meier生存分析显示UBE2C高表达组内膜癌患者生存时间较UBE2C低表达患者组明显缩短(p<0.05)。Cox多元回归分析表明UBE2C是影响内膜癌患者预后的独立危险因素(p=0.047)。9、si-RNA干扰技术抑制UBE2C表达后,内膜癌细胞的增殖、侵袭、迁移能力较阴性及空白对照组均明显降低,细胞凋亡率增加,G2/M期细胞比例增加(p均<0.05)。Western blot结果显示抑制UBE2C表达后,PI3K/Akt信号通路节点蛋白p-PI3K、p-Akt蛋白表达均降低,抑癌基因p53蛋白表达增高。TCGA内膜癌队列的基因组学分析显示,TP53突变,拷贝数扩增,低甲基化均会导致UBE2C异常高表达。GO及KEGG分析显示,UBE2C及其共表达基因可能通过作用于DNA复制,然后影响子宫内膜癌细胞的细胞周期,进而影响了内膜癌细胞的增殖和凋亡。结论:1、整合研究分析了两个GEO数据集(即GSE63678,GSE17025)和TCGA UCEC子宫内膜癌队列最后筛选出344个共同差异表达基因,KEGG通路富集分析结果表明,这些共同DEGs主要富集于细胞周期,卵母细胞减数分裂,细胞衰老,碳代谢和p53信号通路。2、PPI(蛋白质-蛋白质相互作用)网络中排名度数较高的枢纽基因中有15个基因的异常高表达水平与子宫内膜癌的不良预后相关,即CCNB2,CDC20,BUB1B,UBE2C,AURKB,FOXM1,NCAPG,RRM2,TPX2,DLGAP5,CDCA8,CDC45,MKI67,BUB1,KIF2C。3、与正常子宫内膜和不典型子宫内膜组织相比,UBE2C在子宫内膜癌中显著高表达,其表达水平与FIGO晚期、淋巴结转移和患者不良预后相关。Cox风险模型表明UBE2C高表达是内膜癌患者不良预后的独立危险因素。4、UBE2C可通过PI3K/Akt信号通路促进内膜癌细胞的增殖、迁移、侵袭,抑制细胞的凋亡,促进G2/M期转化。体细胞突变,拷贝数扩增,DNA甲基化不足均可致UBE2C在内膜癌中异常高表达水平。