登录

FDA将于6月全面推广AI审评

嘉峪检测网 2025-05-12 08:34

导读:5月8日,FDA宣布一项重大计划,打算在6月全面推广人工智能(AI)工具,以协助进行科学审评工作。

5月8日,FDA宣布一项重大计划,打算在6月全面推广人工智能(AI)工具,以协助进行科学审评工作。这一决策是在FDA声称其成功完成一个将生成式AI(Generative AI,即ChatGPT和DeepSeek所基于的技术)融入审评流程的试点项目后做出的。

 

FDA局长Martin Makary指示所有FDA中心立即开始部署AI辅助审评系统,目标是缩短科学审评过程中任务的执行时间。FDA表示将推行一个“激进的时间表”,以在6月30日之前实现AI工具在各中心的“全面整合”。这样的节奏远超行业预期。然而,FDA并未提供太多关于试点项目的细节,也没有具体说明涉及的产品类型或任务,以及AI在6月全面整合后能够协助的具体任务类型。

 

近年来,FDA一直在探索AI在内部流程中的应用,并于2024年8月在药物评价与研究中心(Center for Drug Evaluation and Research,CDER)内部成立了AI委员会,以监督其与AI相关的活动。此前,前FDA局长Robert Califf也曾讨论过探索在内部运营和监管流程中使用AI技术。此外,近年来,包含AI内容的药物提交数量也显著增加。

 

“接入”AI,满怀期待,迫不及待

 

Makary对首个AI辅助科学审评试点的成功表示叹为观止(blown away),并强调需要重视科学家的时间,减少历史上占据审评过程大部分时间的非生产性杂务。他认为,这些能力在机构范围内的部署有望大幅加快新疗法的审评时间。这一计划与特朗普政府管理和预算办公室(Office of Management and Budget)发布的关于AI使用的备忘录高度一致,该备忘录概述了政府在健康和科学机构中使用AI的计划。

 

CDER新药办公室(Office of New Drugs)药物评价科学办公室(Office of Drug Evaluation Sciences)副主任Jinzhong Liu也表达了类似的观点。他表示,这项技术使他能够在几分钟内完成过去需要三天时间的科学审评任务,这是一项“改变游戏规则”的技术。

 

在推广过程中,FDA表示将继续扩大用途、改进功能,并适应每个中心不断变化的需求。到6月30日,所有中心都将使用一个与FDA内部数据平台集成的共同、安全的生成式AI系统。未来的改进将致力于提高易用性、增加文档整合,并定制输出以满足每个中心的具体需求,同时确保严格的信息安全并遵守FDA政策。

 

此次全面AI推广由新任命的FDA首席AI官Jeremy Walsh和Sridhar Mantha领导。Walsh在加入FDA之前,曾在咨询公司Booz Allen Hamilton担任首席技术专家14年,而Mantha最近曾领导CDER的商业信息办公室(Office of Business Informatics)。据《连线》杂志(Wired)最近的一篇文章报道,Walsh正在与OpenAI(ChatGPT母公司)员工就AI和一个名为CDER CGT的项目进行讨论。

 

Makary在本周二华盛顿特区美国医院协会(American Hospital Association,AHA)的年度会员会议上,讨论了使用AI缩短药物审批过程的必要性。他问道“为什么一种新药上市需要超过10年?”以及“为什么我们还没有通过AI和其他技术实现现代化?”

 

以上种种,令笔者想起年初国内各行各业“接入DeepSeek”的热潮。但如果缺乏专业团队的设计与迭代、缺乏海量知识的积累与整理,其效果到底如何,也许已经用上AI的识林读者已有实感。

 

接入AI就做审评?仍存五大疑问

 

尽管FDA决心和信心兼具,但该机构在宣布计划时缺乏具体细节,也未回应进一步的细节请求。以下是行业专家发表在外媒Stat的五大关切问题:

 

1. 哪些科学审评环节将被自动化?

 

波士顿麻省总医院(Massachusetts General Hospital)临床数据科学中心负责人Keith Dreyer指出,FDA的审评流程确实需要技术革新,但目前的公告缺乏关于AI模型将如何用于审评流程的关键细节。FDA的公告仅提到AI将帮助审评人员处理“繁琐、重复的任务”,例如索引和总结大型文档,这虽然是生成式AI在学术科学中的常见应用,但也容易出现“幻觉”问题。

 

而且,FDA在4月的研讨会上展示的应用场景可能远不止文献综述。FDA国家毒理学研究中心(National Center for Toxicological Research)生物信息学和生物统计学部门负责人Joshua Xu介绍了如何使用生成式AI从药物标签中检测不良反应,并去除重复的不良事件报告。FDA发言人表示:“负责任地使用AI可以增强监管严格性,帮助预测某些条件下的毒性和不良事件。”

 

但Dreyer质疑AI是否足以应用于更关键的任务,例如帮助审评人员决定是否达到批准产品的证据门槛。

 

2. 如何为企业保密并确保准确性?

 

在4月的研讨会上,Xu还介绍了一个名为“AskFDA Documents”的工具,被称为“FDA文档AI聊天机器人”。这种用例与许多行业(包括医疗系统)中部署的生成式AI工具一致:通过查询内部资源(如FDA的指导文件)来获取答案,而不是寻找完全正确的参考文件。

 

但如果这样的聊天机器人被用于检索更敏感的信息,例如药物或器械申请人提交的商业机密,就需要更严格的控制和保护措施。但根据FDA的公告,到6月30日,所有FDA中心将使用一个与FDA内部数据平台集成的通用生成式AI系统。

 

申请人可能会从这项技术中受益,因为它可以加快FDA缓慢且繁琐的审评流程,该流程通常需要数年时间,并且需要生成数千页的监管文件,具体取决于产品类型。但申请人可能也希望确保FDA的AI能够准确总结可能对审评人员决策产生重大影响的信息,Dreyer建议:“如果我要提交一份500页的文件,讨论我的(申报药品的)科学严谨性,并且这些内容将通过算法被精简为3页,也许我应该能够在用于决策之前对其进行评估。”

 

3.FDA审评人员如何接受使用该技术的培训?

 

生成式AI系统众所周知是易变且难以调教的。大型语言模型输出中的“幻觉”仍然很常见。提示语的微小变化可能导致截然不同的响应,甚至出现了专门研究如何精确提出这些请求的职业路径(“提示词工程”)。

 

因此,Dreyer表示,FDA员工的培训以及使用AI输出的协议非常重要。“我希望这不仅能够为FDA提供一个工具和解决方案,还能为医疗保健公共部门提供指导,让他们了解如何按照FDA的定义正确地使用这些工具,”他说,并补充道许多机构也在努力应对自动化偏差的危险,即使用AI的专业人士倾向于遵循机器的结论。“是否存在对AI输出的过度依赖?谁知道呢?”

 

4. 使用了哪些生成式AI模型进行工作,它们是如何训练的?

 

据《连线》杂志报道,FDA官员曾与OpenAI会面,讨论在其药物评估中使用该公司的技术。但目前尚不清楚该公司的技术是否被用于构建目前正在机构范围内广泛实施的产品,或者是否以任何方式被定制以满足FDA的需求。

 

“问题是,他们用什么来训练?”斯克里普斯转化研究所(Scripps Translational Research Institute)主任Eric Topol说,他研究AI模型的开发和实施。“他们是否使用了过去10年的每一次FDA审评来训练?他们使用了什么来专门微调这个模型?”

 

FDA的内部方法可能会给药企提供参考;今年1月,FDA发布了其关于在药物监管决策中使用AI的第一份草案指南《使用人工智能支持药品和生物制品监管决策的考量》,有助于FDA应用其开发的评估AI工具可信度的框架。

 

Topol表示,关于AI训练的问题直接关系到产品的性能,并可能解释出现的问题,例如幻觉或其他输出错误。他补充说,目前关于用于训练OpenAI模型和其他广泛使用的生成式工具的数据信息非常有限。当涉及到联邦政府训练具有不断演变的能力和应用的AI模型时,这种缺乏透明度的情况更加复杂。

 

5. 如何在6月底前完成部署?

 

鉴于上述诸多不确定风险,FDA推出AI模型的速度让几位科学家感到担忧。

 

Topol他赞赏利用AI进行监管审评的努力,并相信这代表了这项工作更好的未来,但他希望看到证明其有效性与当前流程相比的证据,即某种程度的验证。

 

“要证明这一点,你必须同时采用旧方法和新方法,并证明在转向生成式AI的过程中没有任何损失,”Topol说,然而目前尚不清楚FDA的试点研究中做了什么,或者有什么证据支持其新闻稿中声称的“改变游戏规则”的技术。

 

 

来源:识林

关键词: AI审评

相关资讯

我要检测 电话咨询