文章预览
将 ScienceAI 设为 星标 第一时间掌握 新鲜的 AI for Science 资讯 编辑 | ScienceAI 近日,上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队,在 arXiv 预印平台发布文章《 Towards Evaluating and Building Versatile Large Language Models for Medicine 》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。 文中所涉及的所有数据和代码、模型均已开源。 GitHub: https://github.com/MAGIC-AI4Med/MedS-Ins Paper Link: https://arxiv.org/abs/2408.12547 Leaderboard: https://henrychur.github.io/MedS-Bench/ 概览 近年来,大型语言模型(LLM)取得了显著的进展,并在医疗领域取得了一定成果。这些模型在医学多项选择问答(MCQA)基准测试中展现出高效的能力,并且 UMLS 等专业考试中达到或超过专家水平。 然而,LLM 距离实际临床场景中的应用仍然有相当长的距离。其主要问题,集
………………………………