专栏名称: AIGC Studio
一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
今天看啥  ›  专栏  ›  AIGC Studio

腾讯开源SEED-Story:AI续写小说还能自动配图!

AIGC Studio  · 公众号  ·  · 2024-09-30 00:00

文章预览

随着图像生成和开放式文本生成技术的显著进步,交错图像文本内容的创建已成为一个越来越引人关注的领域。 多模态故事生成的特点是以交错的方式生成叙述性文本和生动的图像,已成为一项具有广泛应用价值的实用任务。 香港科技大学、香港中文大学和腾讯的研究团队,提出了一种利用多模态大语言模型(MLLM)生成扩展多模态故事的新方法——SEED-Story。 该模型建立在多模态大语言模型强大的理解能力基础之上,可以预测文本 token 和视觉 token,然后通过一个经过调整的视觉 de-tokenizer 进行处理,生成具有一致字符和风格的图像。 相关链接 论文地址:https://arxiv.org/pdf/2407.08683 项目地址:https://github.com/TencentARC/SEED-Story 论文阅读 SEED-Story: 使用大型语言模型生成 多模态长故事 摘要 随着图像生成和开放格式文本生成的显著进步,交错图像文本 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览