主要观点总结
文章介绍了机器之心AIxiv专栏和新一代的三维生成大模型3DTopia-XL。3DTopia-XL能够直接从图片或文字生成具有PBR材质的高质量三维数字资产,已开源并提供了在线Demo。该模型采用全新的三维表征PrimX和基于DiT的生成架构,能够在5秒内完成从图像或文本生成超写实三维模型。文章还介绍了模型的技术细节、实验结果和未来的发展方向。
关键观点总结
关键观点1: 机器之心AIxiv专栏介绍
机器之心AIxiv专栏是发布学术、技术内容的栏目,过去数年接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。
关键观点2: 新一代三维生成大模型3DTopia-XL的介绍
3DTopia-XL是一个能够从图片或文字单阶段直出具有PBR材质的高质量三维数字资产的模型。采用全新的三维表征PrimX和基于DiT的生成架构,具有10亿规模参数,生成结果作为GLB格式的三维资产可以无缝导入到主流游戏引擎和工业设计软件中。
关键观点3: 3DTopia-XL的技术细节与实验
3DTopia-XL通过PrimX表征三维物体,采用扩散大模型直出技术实现超写实工业级三维资产的秒级生成。模型具备光滑表面、精细结构和良好拓扑,通过DDIM采样策略实现快速去噪。实验结果定量对比上超越现有开源模型,展现巨大潜力。
关键观点4: 3DTopia-XL的应用前景
3DTopia-XL将代码、预训练模型和技术报告开源,并计划更新其他模态的预训练模型。未来还将提供多模态输入支持,包括文生三维模型和多视角重建模型,为三维内容创作提供全面的解决方案套装。
文章预览
AIxiv 专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心 AIxiv 专栏接收报道了 2000 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 是否还在苦恼于开源图生 / 文生三维模型无法直接嵌入到 CG 工作流中?是否在寻找具备高质量几何与物理材质的三维生成大模型? 最近, 上海人工智能实验室(Shanghai AI Lab) 与 南洋理工大学(NTU) 共同推出了新一代的三维生成大模型 3DTopia-XL ,能够从图片或文字单阶段直出具有 PBR(物理渲染)材质的高质量三维数字资产。 在技术细节上,通过采用全新的三维表征 PrimX 以及基于 DiT 的生成架构,具有 10 亿规模参数的 3DTopia-XL 能够在 5 秒内 完成从图像或文本生成
………………………………