2025年7月,迈瑞的AI乳腺超声辅助评估软件(Smart Breast)进入创新医疗器械特别审查通道,乳腺超声辅助诊断AI软件再次成为医疗器械行业的焦点。
乳腺超声辅助诊断AI软件是基于深度学习算法,通过对大规模乳腺超声图像训练,用于自动病灶检测与分割、病灶测量与参数计算、智能生成报告及自动提供辅助诊断建议,为乳腺癌预防提供了技术保障。
本文基于瑞旭CRO在乳腺超声辅助诊断AI软件临床试验经验及相关指导原则,从临床试验设计类型、金标准及阅片方式、评价指标等关键要素进行了分析和设计经验分享,为乳腺超声辅助诊断AI软件的临床试验设计提供参考。
乳腺超声辅助诊断AI软件临床试验设计类型
乳腺超声辅助诊断AI软件的临床意义在于提升临床医生对于病变检测的准确度以及工作效率,因此需开展对照试验,可设置试验组为AI辅助临床医生阅片,对照组为临床医生独立阅片。考虑乳腺超声辅助诊断AI软件为基于非实时影像的辅助检测产品,因此可优先考虑选择MRMC(Multi-Reader Multi-Case 多阅片者多病例)设计。MRMC有多种设计方式,可采用其中常见的配对阅片者配对病例设计,即全部阅片者对每一种阅片方式下所有患者的影像数据给出阅片结果。该设计为全交叉设计,医生需要采用不同的阅片方式阅片,后一种阅片方式下医生的判读可能会受到记忆中前一阅片方式下的信息干预而影响结果,因此在两种阅片方式之间可设置适当的洗脱期。建议设置至少4周的洗脱期,因为洗脱期间隔时间越长,阅片过程中记忆偏倚相对越小。具体新阅片流程如下图:
备注:影像数据分为4组,A代表该组影像数据的阅片方式为AI辅助临床医生阅片,B代表该组影像数据的阅片方式为临床医生独立阅片。
乳腺超声辅助诊断AI软件临床试验金标准和阅片者
(1)金标准
可采用3位高年资(具有高级职称,10年以上工作经验)临床影像科专家独立阅片建立金标准。三位专家独立阅片并给出诊断结果,最终以一致率≥2结果作为一致的诊断结果,即该例患者影像的最终结果。
(2)阅片者要求
考虑到乳腺超声辅助诊断AI软件的预期使用情况,并且为充分反映该软件对不同年资医生诊断能力的提高,试验中可同时纳入低、中、高不同年资的医生。此外还应注意,参与金标准建立的专家不再作为阅片者参与阅片。
乳腺超声辅助诊断AI软件临床评价标准
乳腺超声辅助诊断AI软件临床试验优先考虑ROC曲线下面积(Area Under Curve,AUC)、灵敏度、特异度等诊断准确性指标为主要评价指标。同时,临床试验设计时应考虑整体的优效设计。当主要评价指标设置为基于病例水平BI-RADS评级的AUC(基于阳性、阴性两分法,以BI-RADS评级≥4为阳性)时,最终的临床试验结果应为AI辅助阅片的AUC优于医生独立阅片的AUC,此时可认为临床试验成功。
乳腺超声辅助诊断AI软件临床试验次要评价指标
(1)基于病例水平的灵敏度、特异度(基于阳性、阴性两分法,以BI-RADS评级≥4为阳性);
(2)AI辅助阅片和医生独立阅片所用时间平均值;
(3)不同工作经验(低年资、中高年资)的医生由AI软件辅助阅片和医生独立阅片时的AUC;
(4)在病例水平的特异度下,不同病灶大小(直径将其分为≤10 mm组、>10 mm且<20 mm组及≥20 mm组)时,AI辅助阅片和医生独立阅片的灵敏度。
此外还应收集试验过程中发生的不良事件和器械缺陷等,作为安全性评价指标对该AI软件的安全性进行评价。
结束语:
当AI 遇见乳腺超声,技术终点不是“算法多准”,而是“医生更好用、患者更早获益”。愿更多乳腺超声辅助诊断AI产品能早日通过临床试验验证并获得注册批准,兑现乳腺癌“早筛早治”的承诺。
来源:CIRS医械合规动态
关键词:
AI
乳腺超声
临床试验