文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Video Generation|Large-scale Dataset Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content 🐨 Koala-36M 2024-10-10|Kuaishou, SZU, THU|⭐️⭐️ http://arxiv.org/abs/2410.08260v1 https://koala36m.github.io/ 概述 随着视觉生成技术的不断进步,视频数据集的规模迅速扩大,而这些数据集的质量对视频生成模型的性能至关重要。 本文提出了一个名为Koala-36M的大规模高质量视频数据集,旨在解决现有数据集在时间分割、详细字幕和视频质量过滤等方面的不足 。Koala-36M数据集包含3600万个视频片段,平均时长为13.75秒,分辨率为720p,每个视频配有平均202字的详细文本描述。通过提高细粒度条件与视频内容之间的一致性,Koala-36M显著提升了视频生成模型的训练效果。本文还展示
………………………………