论文部分内容阅读
研究背景二尖瓣反流(Mitral regurgitation,MR)是临床上常见的心脏瓣膜问题。中度及以上MR的总体发病率约1.7%。轻度的MR可长期没有明显的临床症状,有较好的预后。严重的MR会引起肺动脉高压、心律失常、心力衰竭,甚至导致死亡。早期诊断、准确评估MR的严重程度至关重要。经胸超声心动图(Transthoracic echocardiography,TTE)是应用最广的评估MR严重程度的影像学方法。根据2017年美国超声心动图学会(American Society of Echocardiography,ASE)发表的《对自体瓣膜反流的无创评估的建议》,MR的评估参数多且复杂,操作步骤繁琐而且耗时多。本研究尝试建立并验证一种便捷有效的评估MR严重程度的方法。目前,人工智能(Artificial Intelligence,AI)是超声医学领域的研究热点,以提高超声诊断效能,降低误诊率,满足日益增长的临床需求。深度学习(Deep Learning,DL)是受人脑工作启发的AI子集,是一种基于人工神经网络(ANN)的更广泛的机器学习方法。卷积神经网络(CNN)是模拟视觉皮层的ANN子类型。卷积神经网络区域(Regions with CNN,R-CNN)进一步将CNN应用于目标检测。Mask R-CNN算法是目前R-CNN系列中性能最好的算法,运行速度快,实现了实例分割功能,得到像素级别的检测结果。查阅国内外文献,应用AI来评估MR严重程度的研究很少,AI结合二维超声心动图实时自动评估MR严重程度的研究更是空白。本研究试图应用Mask R-CNN算法和MR彩色多普勒超声心动图图像,建立实时自动评估MR严重程度的AI模型,这样的AI模型在提高诊断的准确率及诊断效率方面具有巨大潜力。本研究分为两个部分,第一部分是建立基于2017年ASE指南的MR彩色多普勒超声心动图图像数据库。第二部分是建立并验证基于Mask R-CNN算法的评估MR严重程度的AI模型。研究目的本研究的目的为建立并验证基于2017年ASE指南和Mask R-CNN算法的评估MR严重程度的AI模型的诊断性能,从而为临床提供一个新的评估MR的快捷工具。研究方法第一部分建立基于2017年ASE指南的MR彩色多普勒超声心动图图像数据库1.课题设计者及实施者在开始课题前进行2017年ASE指南培训,熟练掌握MR定量评估方法,并通过专家组的理论和操作考核。2.根据2017年ASE指南中MR定量评估方法,2019年1月至2020年12月,按照轻度(grade Ⅰ)、中度(grade Ⅱ和grade Ⅲ)和重度(grade Ⅳ)的分度和分级标准,分别在山东省立第三医院和皖南医学院第一附属医院收集MR彩色多普勒超声心动图图像病例。3.图像收集过程中遇到分级或者分度结果不确定的病例,第三个人的测量结果作为参考。第二部分建立并验证基于Mask R-CNN算法的评估MR严重程度的AI模型1.利用LabelMe软件(3.167)来划分MR超声图像的目标检测区域(ROI),以便通过深度学习技术进行自动分析。2.利用Mask R-CNN算法建立模型,用山东省立第三医院收集的MR彩色多普勒超声心动图图像进行模型训练,用皖南医学院第一附属医院收集的MR彩色多普勒超声心动图图像进行模型验证。最后,在皖南医学院第一附属医院选择MR病例,现实工作中实时自动验证模型的准确性。实时验证数据集选取84例MR超声图像(grade Ⅰ 21例,grade Ⅱ 21 例,grade Ⅲ 20 例和 grade Ⅳ 22 例)。研究结果第一部分根据2017年ASE指南中的MR定量评估方法,于山东省立第三医院收集1132例MR彩色多普勒超声心动图图像(grade Ⅰ 288例,grade Ⅱ 278例,grade Ⅲ 270例和gradeⅣ 296例),皖南医学院第一附属医院收集295例MR超声图像(grade Ⅰ 82例,grade Ⅱ75 例,grade Ⅲ 74 例和 grade Ⅳ 64 例)。根据本研究收集的病例资料,女性MR患者多于男性,且随着反流程度加重,平均年龄增大,冠心病、高血压、NYHA分级和EF<50%的发病率逐渐升高,与文献报道相一致。第二部分1.模型性能评估指标及结果L=0.0493,Lbbox=0.0055,Lclass=0.0012,Lmask=0.0427。2.分类指标及评价结果2.1二分类指标及评价结果根据分度分类,轻度、中度和重度MR的分度准确率分别为0.90、0.89和0.91,精确率分别为0.94、0.93和0.87,召回率分别为0.94、0.90和0.92,F1-Score分别为0.94、0.91 和 0.89。根据分级分类,grade Ⅰ、grade Ⅱ、grade Ⅲ和grade Ⅳ MR的分级准确率分别为0.90、0.87、0.81 和 0.91,精确率分别为 0.94、0.88、0.88 和 0.87,召回率分别为 0.94、0.89、0.82和0.92,F1-Score 分别为0.94、0.88、0.85和0.89。2.2多分类指标及评价结果根据分度分类,Macro F1、Micro F1和Kappa系数分别为0.91、0.92和0.87。根据分级分类,Macro F1、Micro F1和Kappa系数分别为0.91、0.92和0.85。3.实时验证模型的准确率根据分度分类,轻度、中度和重度MR的分度准确率分别为0.81、0.80和0.82。根据分级分类,grade Ⅰ、grade Ⅱ、grade Ⅲ和grade Ⅳ MR的分级准确率分别为0.81、0.76、0.75 和 0.82。结论1.成功建立基于2017年ASE指南的MR彩色多普勒超声心动图图像数据库。2.成功建立基于Mask R-CNN算法的评估MR严重程度的AI模型。3.基于2017年ASE指南建立的MR彩色多普勒超声心动图图像AI模型具有良好的诊断效能。