专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知  · 公众号  ·  · 2024-12-17 11:00
    

文章预览

随着基础模型(包括大规模视觉语言模型)的最新进展,许多研究者探讨了将多模态数据作为视觉问答输入的结合方法。在医疗领域,视觉问答的一个关键应用是自动化医学报告生成,其中可能提供胸部X光图像和患者基于文本的症状数据,目的是生成相关的医学报告。然而,很少有研究分析这些模型与单模态微调的大型语言模型(LLM)的性能差异,更少有研究比较这些多模态模型在提供症状信息作为输入时的表现。此外,过去的研究通常使用简单的评估指标,如n-gram重叠(例如BLEU和ROUGE分数),这些指标对于能够生成不同句子但具有相同语义意义的生成式基础模型并不有效。 本文的主要贡献有两个。首先,我们比较了多种医学报告生成方法在胸部X光医学报告数据集上的表现,包括单模态微调的医学LLM、没有症状数据的多模态模型和包含症状数据 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览