论文部分内容阅读
第一部分螺旋CT多参数测量在结直肠癌旁肿瘤沉积的诊断价值研究目的探讨螺旋计算机X线断层扫描(Computed Tomography,CT)多参数测量在结直肠癌(Colorectal cancel,CRC)旁肿瘤沉积(Tumor Deposition,TD)中的价值,筛选出最佳诊断参数值。材料与方法回顾分析经病理证实且CT上可辨识的CRC旁TD病灶45枚,转移淋巴结(Metastasis Lymph Node,MLN)病灶45枚,患者手术前均行全腹部螺旋CT平扫、动静脉期增强扫描。测量CRC旁TD、MLN多个参数值,包括病灶的长径线、短径线、平均径、长短径线比、平扫CT值,动脉期CT值及静脉期CT值。比较2组病灶的多参数值及其诊断效能。结果TD组病灶长径线、短径线、平均径(1.29±0.40cm)(1.11(0.74~1.21)cm)(1.185(0.8~1.28)cm)均>MLN组(1.14±0.64cm)(0.93(0.85~1.11)cm)(0.97(0.88~1.21)cm),长短径线比(1.08(1.07~1.13))MLN组(15.44±6.95 Hu)(20.08±11.85 Hu)(43.66±16.18Hu),其中平扫CT值、长短径线比、动脉期强化CT值差异有统计学意义(P<0.05),进行受试者工作特征(ROC)曲线的曲线下面积(AUC)均>0.716,其中平扫CT值、长短径线比、动脉期强化CT值诊断效能为佳,其AUC分别为0.893、0.825、0.716,最佳截断点值分别为>18.5HU、<1.134、>31.50HU,敏感性分别为84.44%、75.56%、51%,特异性分别为77.78%、80%、100%。结论TD组与MLN组多参数测量比较中长径线、短径线、平均径、静脉期强化值差异无统计学意义;平扫CT值、长短径线比、动脉期CT强化值差异有统计学意义,平扫CT值、长短径线比、动脉期CT强化值AUC均>0.716,诊断效能较佳,提示螺旋CT多参数测量对鉴别CRC旁TD与MLN有较大价值。第二部分CT纹理分析、机器学习在鉴别结直肠癌旁肿瘤沉积与MLN的价值初步分析研究目的探讨CT图像3D纹理分析(texture analysis,TA)、机器学习(Machine Learning,ML)在鉴别结直肠癌(CRC)旁肿瘤沉积(TD)与转移淋巴结(MLN)中的诊断价值。材料与方法回顾分析经手术病理证实且CT图像上可辨识的CRC旁TD病灶45枚,MLN病灶45枚,术前一周内均行全腹部CT平扫、动静脉双期增强扫描。通过Ma Zda(Version 4.6)软件对静脉期增强轴位图像进行3D纹理分析,提取各个病灶的3D纹理参数,包括3D直方图、3D灰度共生矩阵(GLCM)、3D游程矩阵(RUN)、绝对梯度(GRA)、自回归模型(ARM)及小波转换(WAV)六大类共794个纹理特征参数值,纹理特征选择方法使用软件内置的费尔系数(Fisher)、分类错误概率联合平均相关系数(POE+ACC)和交互信息(MI)及上述3种方法的联合(FPM),并由内置的B11模块的原始数据分析(RDA)、主成分分析(PCA)、线性分类分析(LDA)和非线性分类分析(NDA)四大分类方法对这些纹理参数进行分类统计分析,各纹理特征参数的诊断结果以误判率形式显示。对上述经FPM法选取的30个最优纹理参数进行PCA特征值降维,抽取选择特征根>1对应的主成分,选择出对术后病理诊断有价值的特征,并将90枚(TD病灶45枚,MLN病灶45枚)样本随机分为训练集和测试集,70%的样本做训练集训练ML模型,30%的样本做测试集,使用降维后的特征并用Python编写程序建立随机森林,决策树,贝叶斯,逻辑回归4种较常用的ML模型,对模型的准确率进行验证,并获得了ROC曲线及曲线下面积(AUC)。采用SPSS 22.0软件非参数统计比较TD与MLN的30个最优纹理参数间的统计学差异,并使用Med Calc 15.8软件,对差异具有统计学意义的纹理参数进行ROC曲线分析并计算AUC,分析2组病灶纹理参数值及比较其诊断效能。结果TD组及MLN组纹理特征选择中,Fisher系数、POE+ACC和MI及FPM鉴别两类病变的误判率分别为7.78%~22.22%、10.00%~31.11%、6.67%~16.67%及4.44%~18.89%。特征分类统计方法中,NDA对两种病变的误判率(4.44%~10.00%)较RDA(15.5%~26.67%)、PCA(16.67%~31.11%)和LDA(10.00~30.00%)均低。基于螺旋CT静脉期增强图像的三维纹理特征,采用非线性分类分析(NDA)的误判率最低,其中FPM联合非线性分类分析(NDA)的误判率最低,误判率为4.44%。在TD组与MLN组30个最优纹理参数中,其中3D直方图参数5个,3D灰度共生矩阵10个,3D游程矩阵10个,绝对梯度3个,自回归模型2个,均有统计学意义(P<0.05);抽取30个最优纹理参数的主成分建立的随机森林法,决策树,贝叶斯,逻辑回归法4种ML模型的准确率为81.48%~93.33%,均>81.48%;AUC为0.76~0.87,均>0.76;其中贝叶斯的准确率最高为93.33%(25/27)、AUC最大为0.87。TD组与MLN组各纹理参数诊断效能分析,采用FPM法选择出30个最优纹理特征参数,均有统计学意义;30个最优纹理参数进行ROC曲线分析中,有15个特征AUC>0.70,其中AUC在0.70-0.799范围有10个,在0.8-0.899范围有4个,在>0.9范围内有1个;3D直方图中AUC最高为90%灰度百分位3D,其AUC=0.947,特异度为84.4%,敏感度为97.8%;3D灰度共生矩阵中AUC最高为S(0,5,5)熵,其AUC=0.777,特异度为68.9%,敏感度为75.6%;游程矩阵中AUC最高为135°长游程补偿,其AUC=0.878,特异度为91.1%,敏感度为77.8%;自回归模型中AUC最高为Teta2,其AUC=0.756,特异度为73.3%,敏感度为77.8%;绝对梯度内各纹理参数AUC均低于0.35,提示诊断效能欠佳;六大类共794个纹理特征经FPM法选择的30个最优纹理参数值中,AUC最高的为3D直方图中的90%灰度百分位3D,其AUC=0.947,特异度为84.4%,敏感度为97.8%。结论1.基于螺旋CT静脉期增强图像的3D纹理特征,TD组及MLN组纹理特征选择与特征分类统计方法中采用非线性分类分析(NDA)的误判率最低,其中FPM联合NDA的误判率最低,误判率为4.44%。2.基于抽取FPM法选择的30个最优纹理特征主成分建立的4种主流ML模型中,准确率为81.48%~93.33%,均>81.48%;AUC为0.76~0.87,均>0.76,提示准确率及诊断效能均为佳;贝叶斯算法准确率最高为93.33%(25/27),AUC最大为0.87,高于其他三种模型的拟合效果,代表贝叶斯算法的较其他模型有更为优秀的分类能力。3.基于螺旋CT静脉期增强图像的3D纹理分析方法能为CRC旁TD与MLN诊断与鉴别诊断提供很好的量化的客观的依据,六大类共794个纹理特征参数值中,AUC最高的为3D直方图中的90%灰度百分位3D,其AUC=0.947,特异度为84.4%,敏感度为97.8%,提示有很好的临床应用价值,有助于提高CRC的N分期并提供更加准确的影像诊断信息。