今天看啥  ›  专栏  ›  大数据文摘

AI完败于人类医生!研究发现:大模型临床决策草率且不安全,最低正确率仅13%

大数据文摘  · 公众号  · 大数据  · 2024-07-30 18:11
    

文章预览

大数据文摘授权转载自学术头条 人类医生,会因为 ChatGPT 等大模型纷纷下岗吗? 这种担心,并非空穴来风。毕竟,谷歌的大模型(Med-PaLM 2)已经轻松拿下了美国医学执照考试,达到了医学专家的水平。 然而,一项最新研究表明:在临床方面,人类医生完胜目前的人工智能(AI)模型,无需过于担心个人「失业问题」。 相关研究论文以“Evaluation and mitigation of the limitations of large language models in clinical decision-making”为题,已于近日发表在科学期刊 Nature Medicine 上。 该研究发现,即使是目前最先进的大语言模型(LLM)也无法为所有患者做出准确诊断,且表现明显差于人类医生—— 医生的诊断正确率为 89%,而 LLM 的诊断正确率仅为 73%。在一个极端情况(胆囊炎诊断)下,LLM 正确率仅为 13%。 更令人惊讶的是,随着对病例信息的了解增多,LLM 的诊断准确 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览