论文部分内容阅读
目的慢性萎缩性胃炎(Chronic Atrophic Gastritis,CAG)是常见的慢性炎症性消化系统疾病,是世界卫生组织公认的胃癌前疾病。目前CAG的诊断主要依赖内镜下活组织检查,然而在白光内镜下,CAG内镜与病理诊断的符合率较低,内镜下CAG的诊断有很大的检查者差异。人工智能(artificial intelligence,AI)技术有强大的视觉识别、数据处理能力,能应用于消化内镜领域,辅助医师内镜下诊断疾病,减少疾病的漏诊。本研究基于深度学习构建胃镜图像辅助识别系统,评估其诊断性能,旨在探讨其在CAG内镜下诊断方面的临床应用价值。方法选取2018年4月至2020年8月在青岛市市立医院内镜中心行胃镜检查并行病理检查的患者,收集其胃镜图像并统计病理结果。共纳入1563名患者的3813张胃镜图像,包括CAG图像1927张,慢性非萎缩性胃炎(Chronic Non-atrophic Gastritis,CNAG)图像1886张。根据8:1:1的比例随机将图像分为训练集、调整集及测试集,选取其中3055张图片(CAG 1541张,CNAG 1514张)为训练集,用来训练模型,自动学习CAG特征;379张图片(CAG 193张,CNAG 186张)为调整集,用于验证模型性能,并根据结果调整模型参数;剩余的379张图片为测试集,用于测试最终模型诊断性能。最后绘制受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC曲线),计算曲线下面积(Area Under the Curve,AUC),绘制精确率-召回率曲线(Precision-Recall Curve,P-R曲线),并计算其曲线下面积(Average Precision,AP),计算模型的召回率、F1-score,计算诊断CAG的敏感度、特异度、准确度、阳性预测值(Positive Predictive Value,PPV)及阴性预测值(Negative Predictive Value,NPV),计算假阳性率、假阴性率,分析造成假阳性及假阴性的原因。同时请3位低年资、3位高年资内镜医师对测试集的图像进行诊断,比较医师及模型的诊断结果,评价模型的诊断性能。结果1.本研究共纳入CAG患者802例,其中男性407例、女性395例,年龄26~89岁,平均年龄59.72±9.99岁;CNAG患者761例,其中男性376例、女性385例,年龄27~88岁,平均年龄58.32±10.20岁。CAG患者伴有粘膜轻度萎缩者519人、中度萎缩者227人、重度萎缩者56人,伴有肠上皮化生者793名,不伴肠上皮化生者9名。CNAG患者中伴有肠上皮化生者236名,不伴有肠上皮化生者525名。2.收集的1927张CAG胃镜图像中,胃粘膜轻度萎缩的有1250张,中度萎缩540张,重度萎缩137张;伴肠上皮化生1903张,不伴肠上皮化生24张。1886张CNAG的图像中,伴肠化的有579张,不伴肠化1886张。3.该CAG图像识别模型ROC曲线的曲线下面积AUC为0.9168,AP值达0.9316,敏感度为89.1%,特异度为74.2%,准确度为81.8%,PPV78.18%(172/220),NPV86.79%(138/159),召回率89.1%,F1-score为83.3%。平均一张图片的诊断时间为(30±3)ms。4.在379张测试集图像中,有48张CNAG被错误的识别为CAG,假阳性率为25.81%,有21张CAG图像被错认为CNAG,假阴性率为10.89%。5.3位低年资内镜医师诊断的敏感度为73.4%,特异度为59.3%,准确度为66.5%;3位高年资内镜医师诊断的敏感度为86.4%,特异度为68.8%,准确度达77.7%。分别与模型的诊断结果相比较,模型的敏感度、特异度及准确度均高于低年资内镜医师(P<0.05),可达经验丰富的内镜医师水平。结论1.基于深度学习技术构建的慢性萎缩性胃炎辅助诊断模型具有较高的ROC曲线下面积及P-R曲线下面积,可提高内镜下慢性萎缩性胃炎的诊断率。2.基于深度学习技术构建的慢性萎缩性胃炎辅助诊断模型具有较高的敏感度、特异度及准确度,可有效提高年轻内镜医师、基层医师内镜下的诊疗水平。