文章预览
开放视频数据集稀缺,因此减缓了开源视频 AI 的发展。为此,我们构建了 FineVideo ,这是一个包含 43,000 个视频的数据集,总时长为 3,400 小时,并带有丰富的描述、叙事细节、场景分割和问答对。 FineVideo https://hf.co/spaces/HuggingFaceFV/FineVideo-Explorer FineVideo 包含高度多样化的视频和元数据集合,使其成为训练模型理解视频内容、训练扩散模型从文本描述生成视频或使用其结构化数据作为输入训练计算机视觉模型的良好素材。 等等,你还没有看过 FineVideo 吗?通过 数据集探索页面 查看它。 https://hf.co/spaces/HuggingFaceFV/FineVideo-Explorer
关于这篇博客文章 在这篇博客文章中,我们分享了开发 FineVideo 的技术细节和代码: 从 YouTube-Commons 中的 190 万个视频开始,到最终获得 44,000 个带有详细标注的视频。 YouTube-Commons https://hf.co/datasets/PleIAs/
………………………………