AgentClinic：斯坦福和霍普金斯联手打造医疗问答Agent

大语言模型论文跟踪 · 公众号 · · 2024-05-23 20:33

文章预览

AgentClinic：斯坦福和霍普金斯联手打造医疗问答Agent 发布时间：2024 年 05 月 13 日 Agent应用 AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments 诊断与治疗患者是一个复杂且连续的决策过程，医生需获取信息并据此行动。AI 和 LLMs 的进步是临床护理的福音，但现有评估多依赖静态问答，未能模拟实际的互动决策。为此，我们推出了 AgentClinic，一个多模态评估平台，让 LLMs 在模拟临床环境中扮演医生角色，通过对话和数据收集揭示病情。我们提供了两个环境：AgentClinic-NEJM 结合图像与对话，而 AgentClinic-MedQA 仅含对话。我们模拟了偏见，发现这不仅降低了诊断准确性，还影响了患者的合作意愿和信心。在评估顶级 LLMs 时，我们注意到在传统基准上表现优异的模型在 AgentClinic 中却表现不佳。我们发现，患者代理使用的 LLM 对性能有显著影 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博