今天看啥  ›  专栏  ›  计算机与网络安全

多模态大模型评测技术

计算机与网络安全  · 公众号  · 互联网安全  · 2024-10-14 07:57

文章预览

进网络安全行业群 公众号回复  行业群 | 主要评测方式 客观评测:指利用客观评价指标对图文大模型的生成结果进行定量评估,常见的客观评测方式有准确率、召回率、模型推理时间、可支持图片分辨率等。客观评价指标种类多样,可以从各个维度对图文大模型的生成结果进行准确、全面、公平的评价,是对大模型进行评测的主要方式。此外,由于客观评测指标可由计算机直接计算得到,因此能够通过自动化脚本实现批量测试,大幅提高评测效率和规模。 主观评测:指通过人工打分的方式对图文大模型的预测结果进行评价,主要应用于创作类任务中,如图片生成、风格变换、图像合成等7,这些测试用例没有明确的标准答案,因此无法以合适的客观指标进行完整评测。主观评测相较客观评测更加灵活,更能真实反映用户视角下的模型能力,但存在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览