谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

     分类 [Ai资讯]
2025/8/27 11:42:50 浏览量  697 喜欢  8
导读:谷歌医疗AI有多牛?揭秘g-AMIE内部三大智能体,分工明确堪比人类医护顶尖团队。

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

谷歌的新 g-AMIE 不是一个机器人医生。它是一个由三位智能体和医生监督的接诊机器,能够更好地记录信息、减少遗忘,并更快地帮助临床医生制定正确的计划。这也是一个更大转变的一部分:人工智能能够高效地处理医学中繁琐的部分,从而让人类专注于人性化的工作。

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

g-AMIE:用于病史采集的诊断人工智能

诊所的重启

想象一下预约中最脆弱的部分:刚开始的时候。闲聊、症状、半记得的药物,以及埋藏在无关故事中的重要细节。这个接诊过程并不华丽,但它为后续的一切设定了轨迹。如果出错,你将花费剩余的时间追逐影子。

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

谷歌研究一直在悄悄构建一台对接诊过程永不感到厌倦的机器。认识一下 g-AMIE——“有护栏的 AMIE”,这是他们针对诊断对话和推理的研究系统的进化。这个想法非常实用:人工智能负责收集病史,而医生则保持主导地位。谷歌称这种方法为以医生为中心的监督

如果你错过了前情提要,原始的 AMIE 工作系列探讨了大型模型如何进行临床推理并进行真实的患者对话。g-AMIE 将这项研究与在诊所中实际需要的治理相结合。

三个智能体,一个目标:帮助临床医生取得成功

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

g-AMIE 对话/护栏智能体和 SOAP 记录智能体

在后台,g-AMIE 作为一个多智能体系统运行(由 Gemini 2.0 Flash 支持),配备一个用于监督的网络医生办公室

  • 对话智能体——分三个阶段进行对话:开放病史、针对性跟进以细化鉴别诊断,然后进行总结问答。

  • 护栏智能体——防止聊天机器人偏离个别医疗建议、诊断或治疗。如果对话智能体超出范围,护栏会礼貌地进行重写。

  • SOAP 记录智能体——将对话转化为清晰、结构化的SOAP 记录(主观、客观、评估、计划),并附上给患者的草拟消息——准备好供人类审批或丢弃。

重要的测试:临床医生是否真的更喜欢这个输出?

谷歌对 60 个场景进行了随机、盲法的 OSCE 风格研究:一侧是标准化患者,另一侧是 g-AMIE、初级保健医生(PCP)或护士执业者/医生助理(NP/PA)。所有人都在与人工智能相同的规则下工作:仅收集病史,不提供建议。资深临床医生作为监督者,对 SOAP 记录和患者消息进行评分。

结果令人惊讶:

  • g-AMIE 从未让个别医疗建议越过护栏。

  • 它收集到了比任何人类组更多的关键信息。

  • 其SOAP记录被评判为更完整、更准确且更易读。

  • 监督者更倾向于偏好人工智能的文档,并批准其患者消息。

  • 基于g-AMIE收集的信息制定的后续计划和鉴别诊断被评为更合适。

 

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?

g-AMIE 与 g-PCP 和 g-NP/PA 在多个质量维度上的比较

质量与监督接受度

谷歌深夜发布g-AMIE:永不休息的AI护士上岗,医生会被取代还是解放?
鉴别诊断和计划的适宜性

细节(很重要)

  • g-AMIE 语言冗长。测试患者喜欢这种同理心;监督医生花了更多时间进行审查。

  • 偶尔出现幻觉——但其发生率与人类记忆错误相当。

  • 在这些限制下,NP/PA 的表现优于 PCP——这可能是因为 PCP 在收集病史时接受过建议的培训,随后感到束手束脚。换句话说,不要将其解读为人工智能胜过医生。应理解为:新的工作流程,不同的赢家。

 

模式超越单一系统

让我们放大视野。临床人工智能正在分化为两条道路:

  1. 以环境为导向、以文档为主的人工智能,旨在消除文书工作和收件箱的繁琐。

  2. 以推理为主的人工智能,帮助解决鉴别诊断的复杂问题。

微软在两个领域都很活跃

  • 在环境方面,Nuance DAX Copilot 已经投入使用。在西北医学的结果研究中,临床医生报告称在采用后感受到更少的倦怠、笔记质量更高,以及更少的深夜记录时间——这是真实且可衡量的缓解,而不是新闻稿中的花絮。

  • 在推理方面,微软的 MAI 诊断协调器(MAI-DxO)将多个前沿模型整合在一起,并在一组 NEJM 案例记录中报告了 85.5% 的诊断准确率,而 21 名医生的 cohort 则约为20%——在严格、相同条件的测试约束下。这是研究,而非床边可用——但它暗示了一个盒装肿瘤委员会可能的样子。

与此同时,在大型科技公司之外,将信号转化为决策的工具不断获得监管支持。FDA  2021 年批准了 Paige Prostate——首个用于全切片病理学的人工智能,自那时起,连锁反应不断发生。这一点很重要:一旦你的模型能够在病理实验室中获得批准号码,讨论就从酷炫的演示转变为医学法律现实。

为什么这是一种正确的“自动化”

  • 有一种时尚的恐慌,认为人工智能会取代临床医生。实际上并不会。它所做的是转移瓶颈。收集病史、文档处理、患者沟通——这些都是高量、低光荣的任务,直接影响安全性、公平性和成本。如果一个不知疲倦的系统能够在后台捕捉更好的病史并生成无懈可击的 SOAP,医生就能腾出时间去做只有人类才能完成的部分:不确定性、同理心、权衡和信任。

  • g-AMIE 的重要性不在于模型击败了谁,而在于工作流程加上保护措施和监督胜过了单纯的直觉。未来的诊所是一个人工智能始终在线、从不迟到、从不疲惫的地方,而人类则保持负责。

如果你负责一个服务线,现在该怎么做

  • 试点以患者收集为优先的人工智能,配合人类监督。如果你的治理团队感到不安,向他们展示保护措施的方法和 OSCE 风格的评估。

  • 在已证明有效的地方采用环境文档。如果你的临床医生在午夜后还在完成笔记,你不需要一个智囊团——你需要一个采购订单。

  •  IRB 墙内进行诊断协调沙盒实验。收益是真实的,风险也是真实的;将其视为药物试验,而不是小工具演示。

  • 衡量重要的指标:监督者接受率、SOAP 完整性、审查时间以及向面对面护理的升级。如果指标没有变化,终止试点并尝试下一个。

沙子中的界限

医学不是独白,而是在时间压力下进行的二重奏,涉及声誉、执照和生命。使用人工智能的最聪明方式不是将其冠以首席临床医生的头衔,而是让它专注于我们其他人实在太人性化而无法热爱的细节。

g-AMIE 展示了当这种方式得体时的样子:有效的保护措施、可以签署的文档,以及一种工作流程,感觉更像是终于拥有了一个第二大脑,而不是在照看一个机器人。

来源与更多阅读

Google Research: Enabling physician-centered oversight for AMIE (g-AMIE). August 2025.

https://research.google/blog/enabling-physician-centered-oversight-for-amie/

Google Research: AMIE  diagnostic medical reasoning & conversations (background).

https://research.google/blog/amie-a-research-ai-system-for-diagnostic-medical-reasoning-and-conversations/

Nuance (Microsoft): DAX Copilot  general availability

https://news.nuance.com/2024-04-22-Nuance-announces-general-availability-of-Dragon-Ambient-eXperience-Copilot,-enabling-healthcare-providers-to-deliver-higher-quality-care-more-efficiently

Nuance (Microsoft): Northwestern Medicine outcomes / deployment

https://news.nuance.com/2024-08-15-Northwestern-Medicine-Deploys-Nuances-Dragon-Ambient-eXperience-Copilot-to-Reduce-Clinician-Administrative-Burden-and-Enhance-Patient-Experience

Medical Economics summary of Microsoft MAI-DxO (diagnostic orchestration on NEJM cases)  I wasnt able to find a Medical Economics write-up of this specific Microsoft research. As closest high-quality summaries, you can cite: TIME, WIRED

https://time.com/7038572/microsoft-ai-diagnostic-orchestrator/

https://www.wired.com/story/microsoft-ai-doctor-diagnosis-study/

U.S. FDA: De Novo classification for Paige Prostate (digital pathology AI)  FDA De Novo database entry (DEN200080)

https://www.accessdata.fda.gov/scripts/cdrh/cfdocs/cfpmn/denovo.cfm?denknumber=DEN200080

 

微信扫一扫,分享到朋友圈

微信公众号
 苹果iOS虚拟币充值(抖音钻石、快币、薯币、比心币、他趣币、陌陌币充值)

相关推荐