专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
目录
相关文章推荐
今天看啥  ›  专栏  ›  智驾实验室

模型自我精炼:视觉自回归Transformer在单目深度估计中性能SOTA !

智驾实验室  · 公众号  ·  · 2024-11-05 08:00
    

文章预览

ADAS  Laboratory 点击上方 蓝字 关注  智驾实验室           加入【 智驾实验室 】交流群, 获取更多内容和资料 尽管最近在单目深度估计的判别方法上取得了成功,但其质量仍然受到训练数据集的局限。生成方法通过利用中间数据集上的强大先验知识来缓解这一问题。最近的研究表明,经过微调的较大文本到图像扩散模型在深度估计任务上达到了最先进的结果。 同时,自回归生成方法,如视觉自回归建模(VAR),在条件图像合成方面显示出有前景的成果。遵循视觉自回归建模范式,作者介绍了一种基于视觉自回归 Transformer 的自回归深度估计模型。 作者的主要贡献是DepthART   一种新提出的训练方法,将其表述为深度自回归精炼任务。与原始VAR训练程序使用的静态目标不同,作者的方法利用动态目标表述,可以实现模型自我精炼,并在训练过程中集 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览