腾讯推出会写图文故事的模型SEED-Story

GitHubStore · 公众号 · · 2024-07-16 13:04

文章预览

项目简介引入的 SEED-Story 由 MLLM 提供支持，能够根据用户提供的图像和文本生成多模式长故事作为故事的开头。生成的故事由丰富且连贯的叙述文本以及人物和风格一致的图像组成。尽管我们在训练期间最多只使用 10 个序列，但该故事最多可以跨越 25 个多模式序列。给定相同的初始图像但不同的开头文本，SEED-Story 可以生成不同的多模式故事。顶部分支以引用“黄帽子人”的文本开始，导致包含该角色的图像。最下面的分支一开始就没有提及这个人，导致故事与第一个分支不同，将他排除在外。方法在第 1 阶段，我们预训练基于 SD-XL 的去标记器，通过将预训练 ViT 的特征作为输入来重建图像。在第 2 阶段，我们对随机长度的交错图像文本序列进行采样，并通过在可学习查询的输出隐藏状态和目标图像的 ViT 特征之间执行下一个单词预测和图像 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

体坛周报 · 热议 | 利物浦66号公路畅通无阻！曼联终结各赛事4连败

11 小时前

体坛周报 · 热议 | 利物浦66号公路畅通无阻！曼联终结各赛事4连败

11 小时前

江南都市报 · 热议 | 维尼修斯开门“红”，“恶意伤害”对手或被停赛4-12场

2 天前

江南都市报 · 热议 | 维尼修斯开门“红”，“恶意伤害”对手或被停赛4-12场

2 天前

神兽集团 · 国足新一期集训名单出炉

2 天前

神兽集团 · 国足新一期集训名单出炉

2 天前

都市现场 · 2025年首期国足集训名单公布：侯永永首次入选，国安7人

3 天前

都市现场 · 2025年首期国足集训名单公布：侯永永首次入选，国安7人

3 天前

安徽商报 · 国足2025年第一期集训名单公布，武磊、蒋光太因伤缺席

3 天前

安徽商报 · 国足2025年第一期集训名单公布，武磊、蒋光太因伤缺席

3 天前

36氪 · 你真的了解衰老吗？揭秘科学抗老的「底层逻辑」

5 月前

学霸本霸 · 今日最涨姿势的一条冷知识！

3 月前

知产前沿 · 刘志杰程驰 | 关于最高院适用“特意排除原则”的司法裁判标准研究

3 月前

经络通全身 · 白萝卜生吃、熟吃功效相反！想要健康进补，这篇文章要看~

1 月前