论文部分内容阅读
目的基于细胞周期调控相关基因构建新的肝癌预后模型,为预测肝癌的预后及肿瘤治疗提供新的思路和方向。方法肝癌病人的m RNA表达谱和临床数据收集于TCGA肿瘤数据库(The Cancer Genome Atlas)、GEO基因表达数据库(Gene Expression Omnibus)和ICGC肿瘤基因数据库(International Cancer Genome Consortium)。通过R软件分析筛选肝癌的差异表达基因(DEGs),并通过通路与基因功能富集(Pathways and process enrichment analysis,PPEA)方法确定与细胞周期相关的基因集。使用单因素Cox回归分析和Kaplan-Meier曲线联合确定与肝癌预后相关的细胞周期调控基因。使用UALCAN网站在线分析肝细胞癌组织中基因m RNA表达与临床病理参数关系。使用Lasso Cox回归构建和验证肝癌预后模型。利用Kaplan-Meier生存分析确定高低风险组病人之间的生存预后差异。使用时间依赖性受试者工作特征曲线(receiver operating characteristic,ROC)分析评估模型的预测能力。利用多因素Cox回归模型生成的系数整合风险评分与分期、分级、年龄和性别等重要的临床变量生成复合列线图。使用校准曲线(Calibration curve)评价复合列线图校准度。使用决策曲线分析(DCA)评价预后模型风险评分的临床适用度。通过单因素和多因素Cox回归分析确定模型的风险评分是否为总生存期(OS)的独立预后因素。进一步寻找风险评分与肿瘤免疫浸润的关系,利用单样本基因集富集分析(single-sample gene set enrichment analysis,ss GSEA)计算高风险组与低风险组患者肿瘤的免疫微环境差异,包括16种免疫细胞的浸润和13种免疫相关途径。最后通过收集青岛市市立医院肝胆外科3例确诊为肝细胞癌病人的肝癌组织和癌旁组织,对3对临床样本二代测序(Next Generation Sequencing,NGS)进行基因表达水平验证。结果通过肝癌肿瘤组织和正常组织基因转录水平差异分析,共同鉴定了141个DEGs。通路和功能富集分析(PPEA)结果显示肝癌DEGs共参与了409个重要功能及通路。最终筛选得到了95个与细胞周期调控相关的功能及通路,并确定了28个与肝癌细胞周期调控相关基因。通过单因素Cox回归分析和Kaplan-Meier曲线生存分析联合确定了其中有24个细胞周期调控基因与肝癌病人预后显著相关(风险比HR>1)(hazard ratio,HR)(FDR<0.05)。其中首次发现细胞周期调控基因ARID3A转录水平的表达与肝癌患者的肿瘤分级、分期以及性别等临床病理参数都存在显著的相关性(P<0.05)。基于细胞周期调控基因,使用Lasso Cox回归构建了8个基因的肝癌患者预后模型。Kaplan-Meier曲线分析显示,高风险组的总生存期OS明显低于低风险组(TCGA-LIHC构建队列P<0.001)。ROC曲线显示了预后模型具有良好的预后预测准确性和特异性,生存时间1年的ROC曲线下面积(area under curve,AUC)为0.800(95%置信区间为0.737~0.863)(confidence interval,CI),2年AUC为0.750(95%CI=0.687~0.813),3年AUC为0.731(95%CI=0.659~0.804)。风险评分与分期、分级、年龄和性别等重要的临床变量生成复合列线图校准曲线检测出列线图预测与实际观测之间的最佳预测。临床决策曲线分析(Decision curve analysis,DCA)显示风险评分显现出更大的净收益,表明风险评分在预测肝癌病人预后方面具有最好的临床应用价值。ICGC数据库LIRI-JP肝癌病人验证队列模型风险评分的Kaplan-Meier曲线显示了同样的结果,低风险评分肝癌病人较高风险评分病人有更良好的预后(LIRI-JP验证队列P<0.001);ROC曲线显示了预后模型同样具有良好的预后预测准确性和特异性,生存时间1年的AUC为0.722(95%CI=0.584~0.861),2年AUC为0.739(95%CI=0.633~0.845),3年AUC为0.733(95%CI=0.627~0.839)。单因素和多因素Cox回归分析结果表明风险评分是总生存期OS的独立预后因素(TCGA-LIHC构建队列:HR=3.436,95%CI=2.402~4.916,P<0.001;LIRI-JP验证队列:HR=3.264,95%CI=1.920~5.549,P<0.001)。进一步分析风险评分与肿瘤免疫浸润状态的关联性,我们发现巨噬细胞、Th2细胞,NK细胞和II型IFN应答的比例在低风险组和高风险组患者之间存在显著差异(校正后P<0.05)。最后,临床样本转录水平测序验证结果显示16个肝癌细胞周期调控预后基因在肝癌组织中存在显著高表达(P<0.05)。结论本研究通过筛选肝癌细胞周期相关差异基因,成功构建了细胞周期调控相关的肝癌病人预后模型,验证了模型具有良好的预测价值,找到了模型风险评分与肿瘤免疫浸润之间的关联。为肝癌病人的预后预测和治疗提供新的思路和分子治疗靶点。