文章预览
01 SEED-Story: 用大模型创造漫画长篇故事 SEED-Story是由腾讯 ARC 实验室推出的一个多模态长篇故事生成项目。它基于大型语言模型(MLLM),能够 从用户提供的图像和文本开始,生成包含丰富、连贯的叙事文本以及风格一致的图像的多模态长篇故事。 1️⃣ 开源项目包括啥 多模态故事生成模型: SEED-Story 模型能够生成包含文本和图像的故事,这些故事在角色和风格上保持一致性。 StoryStream 数据集: 项目团队还发布了一个专为多模态故事生成训练和基准测试设计的大规模数据集。 技术方法: SEED-Story 采用了三阶段的方法,包括视觉分词、指令调优和去分词器适应。 2️⃣ 特色功能 ① 用户自定义故事起点: 用户可以提供起始图像和文本,SEED-Story 据此生成故事。 ② 多模态序列生成: 故事可以包含多达 25 个多模态序列,尽管在训练中只使用了最多 10
………………………………