专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

WACV 2025 | 多任务学习提升Visual Anagram生成

将门创投  · 公众号  · 科技创业  · 2024-12-13 08:22
    

文章预览

本文介绍了来自清华大学智能产业研究院的研究团队提出的基于 预训练文生图扩散模型 结合 多任务学习 方法的生成Visual Anagram的方法,此方法无需训练/微调现有模型,并解决了已有方法存在的概念分离与主导等问题,在此生成任务上取得新的最佳性能。 论文题目: Diffusion-based Visual Anagram as Multi-task Learning 论文链接: https://arxiv.org/abs/2412.02693 代码链接: https://github.com/Pixtella/Anagram-MTL 一、研究背景与动机 视觉回文(Visual Anagram) 是一类特殊的图像,在 不同角度 下,他们看起来所 呈现的内容可能完全不同 ,这类视幻觉在很久以前就得到了艺术家、哲学家以及科学家的关注与研究。 早期由艺术家手工创作的Visual Anagram代表包括1892刊载于德国幽默杂志 Fliegende Blät ter 的素描画 Kaninchen und Ente ,这幅画正着看像一只嘴巴朝左的 鸭子 ,但如果将其旋转 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览