腾讯开源SEED-Story，使用大模型轻松生成长故事连环画

灵度智能 · 公众号 · · 2024-08-02 12:26

文章预览

“ SEED-Story: Multimodal Long Story Generation with Large Language Model ” 港科大联合腾讯推出了一个多模态长故事生成模型SEED-Story。SEED-Story可以基于图片和文本，生成丰富、连贯叙事及风格一致的图片长故事。源码已开源！论文地址：https://arxiv.org/pdf/2407.08683 Github地址：https://github.com/TencentARC/SEED-Story 摘要图像生成和文本生成的显著进展推动了交织图像文本内容的创作，多模态故事生成成为一个引人注目的领域。SEED-Story是一种新方法，利用多模态大语言模型生成扩展的多模态故事。模型预测文本和视觉标记，并通过视觉去标记器生成一致的图像。本文提出多模态注意力机制，实现高效生成长序列故事。发布了模型、代码和StoryStream数据集。简介 SEEDStory是一种新方法，利用Multimodal Large Language Models（MLLMs）的理解能力，生成连续的图像和文本。该方法采用预 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

硅谷王川 · 俗话说，同行是冤家。如果突然有八杆子打不着的人攻击你，一定是他把-20241126113937

2 天前

木紫说股 · 下一批涨停股在哪里？

3 天前

木紫说股 · 下一批涨停股在哪里？

3 天前

何夕 · 划线比找利空消息，容易理解得多。以下图科创50日线为例：上周一没-20241125100250

3 天前

爱在冰川 · 2024-11-24 数据

4 天前

爱在冰川 · 2024-11-24 数据

4 天前

聪明投资者 · 警惕美国再通胀风险！泓湖梁文涛最新分享，拆解业绩背后……

6 天前

FM93交通之声 · 最新公告：董事长被查！

4 月前