5秒内快速生成、直出工业级PBR资产，三维扩散模型3DTopia-XL开源

机器之心 · 公众号 · AI · 2024-10-04 08:24

主要观点总结

文章介绍了机器之心AIxiv专栏和新一代的三维生成大模型3DTopia-XL。3DTopia-XL能够直接从图片或文字生成具有PBR材质的高质量三维数字资产，已开源并提供了在线Demo。该模型采用全新的三维表征PrimX和基于DiT的生成架构，能够在5秒内完成从图像或文本生成超写实三维模型。文章还介绍了模型的技术细节、实验结果和未来的发展方向。

关键观点总结

关键观点1: 机器之心AIxiv专栏介绍

机器之心AIxiv专栏是发布学术、技术内容的栏目，过去数年接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。

关键观点2: 新一代三维生成大模型3DTopia-XL的介绍

3DTopia-XL是一个能够从图片或文字单阶段直出具有PBR材质的高质量三维数字资产的模型。采用全新的三维表征PrimX和基于DiT的生成架构，具有10亿规模参数，生成结果作为GLB格式的三维资产可以无缝导入到主流游戏引擎和工业设计软件中。

关键观点3: 3DTopia-XL的技术细节与实验

3DTopia-XL通过PrimX表征三维物体，采用扩散大模型直出技术实现超写实工业级三维资产的秒级生成。模型具备光滑表面、精细结构和良好拓扑，通过DDIM采样策略实现快速去噪。实验结果定量对比上超越现有开源模型，展现巨大潜力。

关键观点4: 3DTopia-XL的应用前景

3DTopia-XL将代码、预训练模型和技术报告开源，并计划更新其他模态的预训练模型。未来还将提供多模态输入支持，包括文生三维模型和多视角重建模型，为三维内容创作提供全面的解决方案套装。

文章预览

AIxiv 专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心 AIxiv 专栏接收报道了 2000 多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 是否还在苦恼于开源图生 / 文生三维模型无法直接嵌入到 CG 工作流中？是否在寻找具备高质量几何与物理材质的三维生成大模型？最近，上海人工智能实验室（Shanghai AI Lab）与南洋理工大学（NTU）共同推出了新一代的三维生成大模型 3DTopia-XL ，能够从图片或文字单阶段直出具有 PBR（物理渲染）材质的高质量三维数字资产。在技术细节上，通过采用全新的三维表征 PrimX 以及基于 DiT 的生成架构，具有 10 亿规模参数的 3DTopia-XL 能够在 5 秒内完成从图像或文本生成 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博