|
MagicQuill:来自蚂蚁集团的智能交互式图像编辑框架 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
Spider:来自腾讯的任意到多种(Any-to-Many)模态生成的多模态大型语言模型 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
TIPO:提升文本到图像(T2I)生成质量的自动提示工程技术 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
GarVerseLOD:实现单张图像高保真度服装重建的3D重建框架 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
无需训练提升扩散模型区域控制能力的提示方法 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
图像再生任务:基于MLLM的文本到图像模型评估新框架 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
黄金噪声学习框架:提升文本到图像扩散模型合成质量的新方法 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |
|
综述:视觉自回归模型的现状与未来展望 ADFeed · 公众号 · · 3 天前 · 访问文章快照 |