今天看啥  ›  专栏  ›  ScienceAI

迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试

ScienceAI  · 公众号  ·  · 2024-09-03 11:45

文章预览

将 ScienceAI   设为 星标 第一时间掌握 新鲜的 AI for Science 资讯 编辑 | ScienceAI 近日,上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队,在 arXiv 预印平台发布文章《 Towards Evaluating and Building Versatile Large Language Models for Medicine 》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。 文中所涉及的所有数据和代码、模型均已开源。 GitHub:  https://github.com/MAGIC-AI4Med/MedS-Ins Paper Link:  https://arxiv.org/abs/2408.12547 Leaderboard:  https://henrychur.github.io/MedS-Bench/ 概览 近年来,大型语言模型(LLM)取得了显著的进展,并在医疗领域取得了一定成果。这些模型在医学多项选择问答(MCQA)基准测试中展现出高效的能力,并且 UMLS 等专业考试中达到或超过专家水平。 然而,LLM 距离实际临床场景中的应用仍然有相当长的距离。其主要问题,集 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览