AGI-Eval团队：AI视频生成模型年度横评，Sora大饼落地，但国产模型仍然领先！

量子位 · 公众号 · AI · 2025-01-04 13:08

主要观点总结

文章介绍了AGI-Eval团队在视频生成模型的评测方面的最新工作，包括Sora、可灵AI等视频生成模型的评测，以及AGI-Eval采用的评测方法和平台。文章还介绍了视频生成模型竞争的现状和趋势。

关键观点总结

关键观点1: 视频生成模型竞争激烈，评测榜单变得尤为重要

文章指出当前视频生成模型的竞争非常激烈，各种模型纷纷推出。为了评估这些模型的真实水平，AGI-Eval团队进行了深入的评测，并提供了详细的榜单数据。

关键观点2: AGI-Eval团队进行了专业的视频生成模型评测

AGI-Eval团队采用了多种评测方法和方式，包括人工主观评测、模型打分和众包评测等，对Sora、可灵AI等视频生成模型进行了全面评估，并提供了详细的榜单数据。评测结果反映了这些模型在不同维度上的表现。

关键观点3: 视频生成模型的评测维度包括视频文本一致性、视频质量、运动质量等

在评测过程中，AGI-Eval团队关注视频生成模型的多个方面，包括视频文本一致性、视频质量、运动质量等。这些维度能够全面反映模型在不同场景下的表现。

关键观点4: AGI-Eval平台基于真实数据回流、能力项拆解等方式进行评测

AGI-Eval平台采用真实数据回流、能力项拆解等方式进行模型评测，旨在提供公正、可信、科学、全面的评测结果。该平台结合了自动与人工评测，能够处理具有一定自由度的问题，准确率高达95%以上。

关键观点5: AGI-Eval团队呼吁大众参与大模型评测工作，共同推动人工智能的发展

AGI-Eval团队号召大众共同参与大模型评测工作，通过人机协作的方式与最新大模型共同完成任务。这种参与不仅有助于建立更直观的区分度，还可以提高任务完成度，进一步提升用户与大模型之间的互动体验。

文章预览

AGI-Eval团队投稿量子位 | 公众号 QbitAI 说到2024年AI圈的热门话题，当然不能错过视频生成模型了！即使是在12月，国内外视频模型的更新脚步依旧没有放缓。其中以Sora、可灵AI为代表。 12月9日，OpenAI正式推出视频产品 Sora 。用户可以创建任意长宽比例的分辨率高达1080p（最长 20 秒）的视频，可接收文本、图像和视频输入并生成新视频作为输出。 12月19日，可灵AI宣布基座模型再升级，视频生成推出可灵1.6 模型，文本响应度、画面美感及运动合理性，均有明显提升，画面更稳定更生动，同时支持标准和高品质模式，特别是1.6模型的图生视频，内部评测比 1.5 模型整体效果提升195%。视频模型竞争激烈，评测榜单也变得尤为重要。 AGI-Eval 通过构建上百条评测数据和专家级人工评测团队，对 Sora 、及国产头部视频生成模型进行了更深度的专业评测。主 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博