论文部分内容阅读
目的:建立食管鳞癌(Esophageal squamous cell carcinoma,ESCC)CT图像的影像组学特征模型,探究其评估肿瘤淋巴结转移的可行性。方法:回顾性分析经食管内镜活组织检查证实为ESCC患者334例,其中淋巴结转移阴性152例,淋巴结转移阳性182例(包括区域性淋巴结转移103例、非区域性淋巴结转移79例)。淋巴结转移状态经区域淋巴结清扫术、扩大区域淋巴结清扫术或超声引导下穿刺活检(如颈部淋巴结)病理证实。在患者的胸部增强CT图像上采用逐层手动方式勾画ESCC可见病灶边缘的感兴趣区,并进行肿瘤影像特征提取,所有特征于二维层面逐层勾画并计算,并于三维重建计算结果。为了保证结果的可重复性,对所有数据进行z-score标准化处理作为预处理步骤。从ESCC患者胸部增强CT图像中提取的特征经一致性检验后选出稳定的特征,然后采用统计分析方法(根据数据分布特征选用独立样本t检验或Mann-Whitney U检验)从稳定特征中选出与淋巴结是否转移差异有统计学意义的特征,最后再将上述步骤选出的特征使用LASSO(Least absolute shrinkage and selection operator)回归分析进行特征降维处理,并选取出合适的特征。将经上述特征降维过程后最终选出的特征建立模型,使用机器学习中Logistic回归的方法建立预测淋巴结转移阳性与淋巴结转移阴性、区域性淋巴结转移与非区域性淋巴结转移的2种分类模型,即Logistic回归模型。第一步运用训练组数据训练模型,使其得到模型诊断效能最佳的特征的最佳系数;第二步用验证组数据验证模型。用受试者工作特性曲线(Receiver operating characteristic curve,ROC)评估两类模型在训练组及验证组的诊断准确效能,评估的指标包括曲线下面积(Area under the curve,AUC)、准确度、敏感度及特异度。从而分析ESCC的影像组学特征及其与淋巴结转移的关系。结果:从最初提取的CT影像组学特征中筛选出稳定特征,在训练组与验证组中,这些特征均与淋巴结转移间的相关性具有统计学意义(P<0.001)。在淋巴结转移阴性与淋巴结转移阳性组,经单因素统计分析及LASSO降维后共筛选出1 1个特征用于建立Logistic模型,在训练组和验证组,该模型预测ESCC淋巴结转移的ROC曲线下面积分别为0.79及0.75,准确率分别为0.75和0.71,敏感性分别为0.98和0.71,特异性分别为0.56和0.71。在淋巴结转移阳性组,经单因素分析及LASSO降维后共筛选出13个特征用于Logistic模型建立,该模型用于预测ESCC患者的区域性淋巴结转移与非区域性淋巴结情况,在训练组和验证组,ROC曲线下面积分别为0.98及0.95,准确率分别为0.94和0.83,敏感性分别为0.97和0.81,特异性分别为0.91和0.86。结论:CT影像组学模型对于评估ESCC淋巴结转移具有较好的效果,影像组学特征还可用于预测ESCC区域淋巴结转移与非区域淋巴结转移情况。