专栏名称: 智驾实验室

欢迎关注“智驾实验室”！本公众号专注于自动驾驶领域，为您带来世界模型的最新研究，多模态大模型的深入解析，以及多模态大模型在自动驾驶领域的应用与落地。在这里，您可以了解到自动驾驶技术的最新动态，洞察行业趋势，与我们一起探索未来出行的无限可能。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

模型自我精炼：视觉自回归Transformer在单目深度估计中性能SOTA ！

智驾实验室 · 公众号 · · 2024-11-05 08:00

文章预览

ADAS Laboratory 点击上方蓝字关注智驾实验室加入【智驾实验室】交流群，获取更多内容和资料尽管最近在单目深度估计的判别方法上取得了成功，但其质量仍然受到训练数据集的局限。生成方法通过利用中间数据集上的强大先验知识来缓解这一问题。最近的研究表明，经过微调的较大文本到图像扩散模型在深度估计任务上达到了最先进的结果。同时，自回归生成方法，如视觉自回归建模（VAR），在条件图像合成方面显示出有前景的成果。遵循视觉自回归建模范式，作者介绍了一种基于视觉自回归 Transformer 的自回归深度估计模型。作者的主要贡献是DepthART 一种新提出的训练方法，将其表述为深度自回归精炼任务。与原始VAR训练程序使用的静态目标不同，作者的方法利用动态目标表述，可以实现模型自我精炼，并在训练过程中集 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博