论文部分内容阅读
目的通过前瞻性选取92例肺腺癌患者并统计其临床资料及影像学征象,筛选与肺腺癌表皮生长因子受体(EGFR)基因突变状态相关的临床预测因素及影像征象,比较基于T2WI、DWI、ADC的影像组学模型及联合临床因素的列线图对术前预测肺腺癌EGFR突变状态的价值。方法前瞻性选取2015年11月至2019年9月经病理证实的肺腺癌患者92例,其中男53例,女39例,年龄27~79岁,平均57.65±10.90岁;EGFR突变型51例,未突变型41例,临床分期:I期34例,II期14例,III期20例,IV期24例,所有患者在术前一周内均行胸部MRI扫描,扫描序列包括T2WI序列、EPI-DWI(b=0、800s/mm~2)序列并生成相应的ADC图。统计92例患者的临床资料包括:年龄、性别、吸烟史、临床分期、术前1周内癌胚抗原,糖类抗原125及糖类抗原153;统计92例患者的MRI影像学征象包括:肿瘤所在的分叶,肿瘤最大径线,分叶征,毛刺征,胸膜凹陷征及ADC值。应用SPSS统计软件分别对EGFR突变型和EGFR未突变型型两组患者的临床资料和影像学征象进行统计分析,筛选与肺腺癌EGFR基因突变状态相关的临床预测因素及MRI影像征象。构建基于磁共振多参数成像的影像组学模型:使用软件ITK‐SNAP分别在T2WI、DWI、ADC图像中,手动勾画、分割所有病灶的所有层面,沿病灶轮廓放置ROI,将所有患者的原始图像及ROI文件导入美国GE公司AK软件进行图像预处理。在AK软件中选择直方图特征(Histogram)、形态学特征(Form Factor Features)、灰度共生矩阵(GLCM)、Haralick参数、灰度游程矩阵(GLRLM)、灰度连通区域矩阵(GLSZM)6大类纹理参数进行特征提取,每例患者的每个序列共提取了396个图像特征。采用R软件将92例患者数据以7:3的比例随机分为训练组(65例)和验证组(27例),并对提取的3D图像特征进行统计学分析并完成相应的统计检验,使用最小绝对收缩和选择算法(LASSO)对影像组学特征进行降维,分别构建ADC、DWI、T2WI序列及合并序列的影像组学标签,纳入合并序列的影像组学标签及临床预测因素建立多因素逻辑回归的联合预测模型,并制作影像组学列线图。采用ROC曲线下面积(AUC)评价5种影像组学模型在肺腺癌EGFR突变的预测效能,采用DeLong检验比较5种模型的预测效能是否有统计学差异(P<0.05为差异有统计学意义)。通过决策曲线评估各个模型不同阈值概率的获益情况,采用校准曲线对列线图的预测效能进行评价。结果92例肺腺癌患者其中男53例,女39例,年龄27~79岁,平均57.65±10.90岁;EGFR突变型51例,未突变型41例,临床分期:I期34例,II期14例,III期20例,IV期24例;有吸烟史28例,无吸烟史64例;CEA:0.27~3101ng/ml,平均106.06±412.86ng/ml;CA125:2.57~2014U/ml,平均86.57±248.13U/ml;CA153:4.57~181.60U/ml,平均27.32±30.80U/ml;92例患者的MRI影像学征象:右上叶27例,右中叶10例,右下叶18例,左上叶24例,左下叶13例,肿瘤最大径范围:1.02~8.93cm,平均3.90±1.99cm,无分叶征53例,有分叶征39例,无毛刺征67例,有毛刺征25例,无胸膜凹陷征68例,有胸膜凹陷征24例,ADC值范围:603~2335mm~2/s,平均1171.59±286.67mm~2/s。EGFR突变型与非突变型两组之间性别、吸烟状态及ADC值有统计学意义差异(P<0.05)。训练组65例,其中突变型39例,未突变型26例,训练组患者性别、吸烟状态具有统计学差异(P<0.05),验证组27例,其中突变型12例,未突变型15例,验证组患者的性别、吸烟状态具有统计学差异(P<0.05)。筛选得到性别及吸烟状态作为预测肺腺癌EGFR基因突变状态的临床因素。对ADC、DWI、T2WI及合并模型所提取的特征进行降维筛选后分别剩余3个、6个、4个、6个特征,训练组和验证组在ADC预测模型,DWI预测模型,T2WI预测模型及合并预测模型的ROC曲线下面积(AUC)分别为0.874(95%可信区间为0.786~0.962)和0.806(95%可信区间为0.611~1.000),0.784(95%可信区间为0.675~0.893)和0.722(95%可信区间为0.520~0.925),0.692(95%可信区间为0.563~0.821)和0.656(95%可信区间为0.439~0.873),0.889(95%可信区间为0.809~0.968)和0.839(95%可信区间为0.685~0.993)。纳入性别、吸烟状态、影像组学标签的联合预测模型在训练组中预测效能的AUC为0.925(95%可信区间为0.856~0.994),敏感度为84.6%,特异度为96.2%,准确率为89.2%;验证组的AUC为0.728(95%可信区间为0.531~0.925),敏感度为66.7%,特异度为73.3%,准确率为70.4%。结论性别及吸烟状态可作为预测肺腺癌EGFR基因突变状态的临床因素。ADC及DWI模型稍优于T2WI模型,多序列影像组学模型较单序列模型预测性能进一步提高。基于MRI影像组学标签及临床因素的列线图可作为一种量化工具预测术前肺腺癌EGFR基因突变风险。