AI完败于人类医生！研究发现：大模型临床决策草率且不安全，最低正确率仅13%

大数据文摘 · 公众号 · 大数据 · 2024-07-30 18:11

文章预览

大数据文摘授权转载自学术头条人类医生，会因为 ChatGPT 等大模型纷纷下岗吗？这种担心，并非空穴来风。毕竟，谷歌的大模型（Med-PaLM 2）已经轻松拿下了美国医学执照考试，达到了医学专家的水平。然而，一项最新研究表明：在临床方面，人类医生完胜目前的人工智能（AI）模型，无需过于担心个人「失业问题」。相关研究论文以“Evaluation and mitigation of the limitations of large language models in clinical decision-making”为题，已于近日发表在科学期刊 Nature Medicine 上。该研究发现，即使是目前最先进的大语言模型（LLM）也无法为所有患者做出准确诊断，且表现明显差于人类医生—— 医生的诊断正确率为 89%，而 LLM 的诊断正确率仅为 73%。在一个极端情况（胆囊炎诊断）下，LLM 正确率仅为 13%。更令人惊讶的是，随着对病例信息的了解增多，LLM 的诊断准确 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人工智能与大数据技术 · 苹果 AI 遭遇「滑铁卢」？73% 用户直言：Apple Intelligence 几乎没用！

2 天前

国家数据局 · 2024年“数据要素×”大赛优秀项目案例集——工业制造案例之三 | 工业品价格大数据赋能供应链协同管理效能提升

2 天前

艺恩数据 · 《小小的我》满意度领衔，高质量影片激活元旦档观影氛围

3 天前

通用技术集团 · 破解大型企业健康管理难题！通用技术健管公司（大数据集团）与鹏城实验室联手研发“脑海·健康领航者”系统

4 天前

通用技术集团 · 破解大型企业健康管理难题！通用技术健管公司（大数据集团）与鹏城实验室联手研发“脑海·健康领航者”系统

4 天前

深圳新闻网 · 紧急！深圳女子被困悬崖

7 月前

晶澳科技 JA Solar · 晶澳科技热烈庆祝新中国75周年华诞

3 月前