#Thieme未来星计划荣誉推出消化病学专题,我们将与未来星计划的小伙伴们持续推荐解读与消化病学相关的最新研究,欢迎关注。同时,欢迎感兴趣的小伙伴加入我们。
本期推荐 & 解读 BY
单飞 | 南昌大学
↓ 消化病学专题丨38
背景
不准确的Forrest分级可能会显著影响临床结局,尤其是在高危患者中,因此,本研究旨在开发一种实时深度卷积神经网络(DCNN)系统来评估消化性溃疡出血(PUB)的Forrest 分级。
方法
回顾性收集来自中国福州市第900医院的训练数据集(3868张内镜图像)和内部验证数据集(834张图像),此外,使用从其他4家医院收集的521张图像进行外部验证,最后前瞻性地收集46个内镜视频来评估DCNN系统的实时诊断性能,其诊断性能也与3名高级和3名初级内镜师进行前瞻性比较。
Endoscopy
He Xiao-Jian et al.
中文内容仅供参考,以英文原文为准,欢迎识别二维码阅读。
纳入标准包括组织学检查确定的良性PUB的内镜数据。排除标准是质量差的图像(例如过多的粘液、气泡、胆汁、食物残渣、模糊、黑暗、离焦、模糊或光晕)、恶性溃疡和胃手术史。此外,包括来自相同PUB病灶的多视图图像,来自相同病灶的图像数量<10,以避免统计依赖性。数据集收集和数据集分布描述于(图1)。回顾性数据集中的内镜图像数量基于数据可用性;因此,图像数量可能差异很大。
图1. 为本研究的工作流程图。
利用称为YOLOv7 的先进智能软件提取由主干、颈部和检测头组成的多尺度特征,构建基于人工智能的PUB检测系统(厦门DCNN医疗技术有限公司)。DCNN系统使用回顾性和前瞻性数据集进行了验证(图 2)。
图2. 基于YOLOv7深度卷积神经网络(DCNN)架构的人工智能溃疡检测系统,在DCNN系统中以多张原始内镜图像作为输入进行处理、训练、验证、测试,图像以不同颜色诊断帧作为输出。
结果
DCNN系统在Forrest分级评估中的诊断性能令人满意,验证数据集中的准确率为91.2%(95%CI 89.5%-92.6%),受试者工作特征曲线下的宏平均面积为0.80。此外,DCNN系统可以在实时视频中使用Forrest分级自动判断可疑区域,准确率为92.0%(95%CI 80.8%-97.8%)。DCNN系统在前瞻性临床比较测试中显示出比内镜师更准确、更稳定的诊断性能。该系统有助于略微提高高级内镜师的诊断性能,并显著提高初级内镜师的诊断性能。
在外部数据集中也表现出令人满意的表现,总体准确率为89.9%(95%CI 87.1%-92.3%),宏观平均AUROC为0.78,平均AUPRC为0.71。Forrest分级中每个类别的DCNN系统诊断的个体准确性、敏感性、特异性、PPV、NPV、AUROC和AUPRC如(表1)。
表1. DCNN系统在两个验证数据集中的测试特征。
在此初始验证后,从验证数据集中选择25名特殊情况患者,如复发性出血,并选择其图像的一个子集来测试DCNN系统,该系统能够准确识别同一PUB病灶中的动态变化,并根据其形态学特征预测病灶的Forrest分级。验证数据集中DCNN系统识别的不同Forrest分级的代表性图像如(图3)所示。
图3. 由DCNN系统诊断的每个Forrest分级类别的代表性图像,具有不同颜色的诊断帧和显示的概率分数:a Forrest Ia(主动喷射出血);b Forrest Ib(主动渗出出血);c Forrest IIa(非出血可见血管);d Forrest IIb(粘附凝块);e Forrest IIc(扁平色素斑点);f Forrest III(清洁溃疡基底)。
在46个内镜视频中,包括50个PUB病变,所有可疑区域都可能是通过内镜检查由DCNN系统同步呈现准确率为92.0%(95%CI 80.8%-97.8%)。此外,DCNN系统可以准确地 对同一PUB病变进行不同情况的分级,如溃疡病变伴粘连内镜灌洗前有血块,内镜灌洗后有少量粘附血块; 内镜冲洗前有活跃渗出的溃疡病变,冲洗后无出血因此,它能够实现动态诊断实时分级PUB病变。(视频1)显示了DCNN系统自动检测和动态评估Forrest PUB病变的分级。
视频1. 视频Ai辅助系统预测各种Forrest分级出血消化性溃疡。
我们使用从视频测试数据集捕获的100张内镜图像来评估内镜师的诊断稳定性。如(表2)所示,初级内镜师的观察者间一致性(kappa 0.54-0.64)低于高级内镜师(kappa 0.78-0.82)。此外,初级内镜师的观察者内一致性(kappa 0.68-0.78)低于高级内镜师(kappa 0.85-0.89)。DCNN系统能够实现极高的诊断一致性。总体而言,DCNN系统表现出比初级和高级内镜师更高的Forrest分级性能。
表2. 内镜医师对Forrest分级诊断的观察者内和观察者间的一致性(Cohen’skappa系数)
结论
DCNN系统对PUB具有较高的诊断准确性,可以帮助内镜医生提高诊断能力,减少诊断时间,降低内镜下判断Forrest分级的培训成本。应进一步研究建立新的视频评分方法,解决现有的局限性,提高DCNN系统在临床实践中评估PUB Forrest分级的诊断准确性。
收获
虽然溃疡出血的内镜下治疗有多种方法,如果不进行必要的内镜下Forrest分级,就很难保证内镜下止血治疗的合理性。非动脉性出血(Ib,IIb,III)的转归明显优于动脉性出血(Ia,IIa),这对溃疡出血患者正确选择内镜治疗还是急诊手术有极其重要的意义。
欧洲消化内镜学会(ESGE)及其附属学会的官方期刊。
Endoscopy为关于胃肠道内窥镜检查的最新技术和国际发展的重要期刊。在国际编委会的专家指导下,本刊提供高质量的内容,以满足全球内窥镜医师、外科医生、临床医生和研究人员的需求。
Endoscopy每年出版12期,内容包括高质量的综述论文、原创论文、前瞻性研究、有价值的诊断和治疗进展调查、以及对最重要的国内和国际会议进行的深入报道。文章经常辅以在线视频内容。
在Endoscopy上出版的所有论文都经过严格的同行评审。基于在线投稿和快速处理,保证了电子版和印刷版的出版速度。