人工智能在早期胃癌检出及性质判断中的临床研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lygzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的:本研究目的是借助深度学习方法,构建基于内镜图像的病变检出和性质判断人工智能模型并评估其临床辅助价值。首先,分别构建白光胃镜和窄带成像(Narrow band imaging,NBI)放大胃镜两种光学模态下的深度学习早期胃癌检出模型,实现早期胃癌病变的“查全”;其次,分别构建白光胃镜胃癌深度判断,NBI放大胃镜早期胃癌分化程度和边界识别模型,实现早期胃癌病变的“查准”;最后,充分验证模型的诊断效能,并评价模型的临床辅助价值,从而为后续的临床转化提高初步数据支持。通过构建早期胃癌检出和性质模型,以期提高早期胃癌诊断水平,实现胃癌个体化治疗。材料与方法:(1)回顾性纳入本中心1364例早期胃癌患者45240张白光胃镜图像,按照时间先后,分为训练集(1085例患者35823张图像)和验证集(279例患者9417张图像)。又纳入另外三家中心60例患者1514张图像作为外部验证集。还纳入了26例患者的26段视频作为视频验证集。本研究使用了YOLOv3进行模型的建立。我们测试了内部验证集和外部验证集中模型的诊断效能,对比了人工智能模型与内镜医师诊断效能的差异,比较了内镜医师在模型辅助前后的诊断表现。我们还测试了模型在视频中的诊断效能。我们使用准确率、敏感性、特异性、阳性预测值、阴性预测值、受试者工作特征曲线下面积(Area under curve,AUC)及一致性Cohen’s Kappa指数来评价诊断的效能。(2)纳入了五家中心的1240例患者21785张NBI放大胃镜图像和20例患者20段视频,其中南京鼓楼医院数据集(1093例患者20208张图像,20例患者20段视频)按照时间段分成了训练集(810例患者13151张图像),时序验证集(283例患者7057张图像)和视频验证集(20例患者20段视频),另外四家中心的数据集(147例患者1577张图像)被分别用作外部验证。本研究使用了基于YOLOv3架构的深度学习算法进行人工智能模型的建立,分别使用图片和视频验证集对模型的诊断效能进行了测试,对比了模型和内镜医师诊断效能的差异。本研究进一步从时序验证集中抽取600张图像作为测试集比较了内镜医师在人工智能模型辅助前后诊断效能的差异。本研究中主要观察指标包括准确率、敏感性、特异性、阳性预测值、阴性预测值、AUC及一致性Cohen’s Kappa指数。(3)回顾性收集两家中心的666例患者3407张白光胃镜图像(训练集)训练Res Net50分类模型判断浸润深度,使用另外62例患者228张图像(测试集)进行模型诊断效能的测试。我们使用测试集和视频测试集(54例患者54段视频)比较了内镜医师在深度学习模型辅助前后的诊断效能。我们进一步通过测试数据集比较了内镜医师在深度学习模型辅助前后的诊断一致性。我们统计了内镜医师的坚毅评分,并探究了其与诊断效能的相关关系。本研究中主要的观察指标是准确率、敏感性、特异性、阳性预测值、阴性预测值、AUC、平均配对一致性Cohen’s Kappa指数及关系数。(4)回顾性纳入了两家中心222例患者3090张图像,其中南京鼓楼医院87例2075张图像用于建立Res Net50分类模型判断分化程度,58例351张图像用于内部验证,无锡市人民医院77例664张图像用于外部验证;南京鼓楼医院中的83例768张图像还用于建立Unet++分割模型,49例160张图像进行内部验证。我们比较了内镜医师与深度学习分类模型在胃癌分化程度中的诊断效能,评估了内镜医师在深度学习分类模型辅助前后诊断效能的变化,还评估了深度学习分类模型辅助下,内镜医师与病理结果以及内镜医师之间诊断一致性的变化。对于分化程度判断模型,主要的观察指标为准确率,敏感性,特异性,阳性预测值,阴性预测值,AUC及一致性Cohen’s Kappa指数;对于边界确定模型,主要的观察指标为Dice,精确度(Precision)和召回率(Recall)。研究结果:(1)白光胃镜早期胃癌检出模型在验证集中敏感性为85.9%–95.5%,特异性为81.7%–90.3%,AUC为0.887–0.940。在测试集中,人工智能模型的诊断准确率(95.3%)高于高年资(87.3%)和低年资(73.6%)内镜医师。内镜医师在模型辅助后,内镜医师的诊断敏感性和特异性都显著提高。人工智能模型诊断的一致性显著高于高年资和低年资内镜医师。人工智能模型可以实现胃镜视频早癌实时识别,敏感性达88.5%。(2)人工智能模型在内部验证集中AUC为0.947,在外部验证集中AUC为0.888–0.951。该模型在视频验证集中诊断敏感性为100.0%。人工智能模型在测试集中的诊断效能(AUC,0.959)显著优于高年资(AUC,0.842–0.880)和低年资内镜医师(AUC,0.777–0.812)。内镜医师在模型辅助后,不同年资的内镜医师的诊断敏感性、特异性、一致性都显著提高。(3)深度学习模型在测试集中的AUC为0.942(95%CI,0.915–0.970),诊断黏膜内癌敏感性为90.5%,特异性为85.3%。在深度学习模型的辅助下,低年资内镜医师诊断黏膜内癌的敏感性为85.4%,特异性为83.3%,准确率为84.6%;高年资内镜医师诊断黏膜内癌的敏感性为87.4%,特异性为83.0%,准确率为85.5%。深度学习模型辅助后,内镜医师诊断一致性提高,内镜医师诊断的时间显著缩短。内镜医师独立诊断准确率与努力评分成正相关,但在深度学习模型辅助后,内镜医师诊断准确率与努力评分不再有相关关系。(4)深度学习分化程度判断模型在验证集中的AUC为0.932,敏感性为90.9%,特异性为91.5%;深度学习胃癌边界确定模型在阈值设为Io U大于0.5时,Dice为0.818,精确度为0.69,召回率为1.00。分化程度判断模型模型诊断效能优于高年资(敏感性,94.7%,特异性63.3%)和低年资(敏感性,68.5%,特异性51.0%)内镜医师。内镜医师在深度学习分类模型的辅助下,诊断效能显著提高,高年资诊断的敏感性和特异性分别为97.7%和84.0%,低年资诊断的敏感性和特异性分别为90.1%和71.6%。内镜医师诊断与病理结果的一致性在模型辅助下都显著提高。研究结论:基于深度学习的早期胃癌检出和性质判断模型具有较好的诊断效能,并能够提高内镜医师病变检出和性质判断准确率和一致性,从而提高早期胃癌诊断水平,实现胃癌患者个体化治疗,推动医疗水平同质化。
其他文献
以电信网络诈骗为代表的新型网络犯罪案件在证明判断中时常陷入定罪困难与权利保障的困境。电子数据证据是网络犯罪案件中重要的证据形式,剖析网络犯罪案件的细致问题,可以将电子数据证据作为分析凭借。从微观视角着眼,电子数据证据具有获取难、固定难、认定难的本体特征,其本体特征将引发证明力平面化的现象;从中观视角审视,网络犯罪证明环节存在定罪证明指向力分散、定量证明技术性乏力的症结。网络犯罪的印证证明需要进行融
近年来,扫描探针显微术不断发展,其测量模式越来越多样,功能越来越强大,得以从微观尺度探索材料的物理化学性质,成为材料科学研究中非常重要的显微技术。扫描探针还可以施加力、电、磁场,对样品进行局部操控,是应用广泛的微加工工具。钙钛矿氧化物由于其晶格、轨道、电荷、自旋等多自由度的相互耦合,展现出丰富且可调控的磁电功能。最近,钙钛矿铁电薄膜中发现了复杂的铁电畴结构和多功能的铁电畴壁。研究畴结构的极化构型、
中红外2~5μm波段高重复频率超短脉冲激光器在高速空间激光通信、天文光频梳和精密光谱学等诸多前沿科学技术领域中均具有重要的应用价值。可靠的高重复频率超短脉冲光是提高光通信系统传输速率与传输容量的核心因素,因此提升红外超快激光源重复频率等核心技术指标是推进激光技术及其前沿交叉领域发展的关键。中红外2~5μm波段激光从产生机理上主要分为包含稀土离子掺杂光纤激光器和量子级联激光器等直接产生的中红外激光技
随着微纳光子学的发展,人们已经可以利用人工微纳结构去灵活地调控光的频率、波矢、偏振和相位,为开发新型光子学器件打开了新的大门。近年来,光子拓扑序——一种量化表征光子能带特性的新参量,提供了调控光子系统特性的新的自由度,为在基本原理上探索全新光子态以及为可能的革命性应用开辟了新方向。其中,波导阵列因调控灵活、简单高效、加工方便而成为拓扑光子学的重要研究体系之一。人们已经构建出多种具有拓扑特性的边界态
行星物质的结构及其动力学演化过程是我们在认识宇宙过程当中所面临的最基本问题之一。根据现有的行星模型,天王星和海王星这类巨行星的大气由氢气和氦气组成,而其内核很小,主要由岩石构成。在岩石内核和大气层之间,则覆盖着厚厚的积冰层,主要由56%的水,36%的甲烷,以及8%的氨气构成。另一方面,氦是自然界中最为惰性的元素,常压下通常被认为不会与其它物质发生化合反应。然而沿着天王星和海王星的等熵线,热冰层内的
作为一种高效的储能系统,锂离子电池自商业化以来已经深刻地改变了人类社会,从各种便携式电子设备到近年来渐热的电动汽车,再到电网的规模化储能,我们无时无刻不在享受着锂离子电池带来的便利。然而,当前商用的层状过渡金属氧化物正极已经逐渐接近其理论容量的极限,难以满足未来对高能量密度和低制造成本的需求,着眼于更长远的未来,需要探索和研发新型的可充电电池。锂硫电池作为极具潜力的高能量密度二次电池备受瞩目,具有
软件是当今信息时代必不可少的基础设施。但软件缺陷引起的事故也频频发生,轻则影响用户体验,重则带来巨大的经济损失甚至危及人身安全。因此,保障软件质量至关重要。软件测试是目前最有效的软件质量保障手段之一,因其易部署、代价低的优点而成为工业实践中最被广泛采纳的技术。自动化地为软件生成测试输入是软件工程领域最重要的研究问题之一。尽管已有诸多技术被相继提出并使用,但目前许多复杂的基础软件系统(如操作系统内核
短视频适应了人们碎片化、间断性的阅读习惯,影响力大且传播速度快,是互联网行业的风口。将电视新闻制作成短视频,需要根据电视新闻自身的特点进行方向定位,并不断对新闻内容进行优化,从而提高新闻质量和传播效果。本文主要针对电视新闻短视频内容的生产以及优化策略进行研究。
为了更好地揭示人类生命活动规律,对人类疾病进行早期诊断,获得更加全面的生物学信息,与生命活动息息相关的蛋白质、多肽、生物活性小分子以及毒性环境污染物是分析检测的重中之重。在近几年的研究中,纳米材料学蓬勃发展,为发展和建立生化分析新方法提供了强有力的支持和前所未有的发展机遇。目前,基于纳米材料的生化分析新方法研究,是生化分析研究中最活跃的研究领域之一。新型纳米材料的发展为建立特异性好、灵敏度高、能耗
受全球人口老龄化加快和生态环境恶化影响,恶性肿瘤的发病率和致死率呈现逐年上升趋势,肿瘤的诊断和治疗仍然是现代生物医学的重要挑战之一。区别于正常的生理组织,恶性肿瘤表现出一些特殊的微环境,如弱酸性,氧气匮乏,高活性氧浓度,多种过表达酶以及还原性微环境等等。这些特殊的生理微环境严重制约着肿瘤的治愈,也是肿瘤转移和复发的主要诱因,尤其是肿瘤乏氧问题,一直困扰着我们,是治愈肿瘤的关键性问题。肿瘤的乏氧微环