文章预览
ADAS Laboratory 点击上方 蓝字 关注 智驾实验室 加入【 智驾实验室 】交流群, 获取更多内容和资料 尽管最近在单目深度估计的判别方法上取得了成功,但其质量仍然受到训练数据集的局限。生成方法通过利用中间数据集上的强大先验知识来缓解这一问题。最近的研究表明,经过微调的较大文本到图像扩散模型在深度估计任务上达到了最先进的结果。 同时,自回归生成方法,如视觉自回归建模(VAR),在条件图像合成方面显示出有前景的成果。遵循视觉自回归建模范式,作者介绍了一种基于视觉自回归 Transformer 的自回归深度估计模型。 作者的主要贡献是DepthART 一种新提出的训练方法,将其表述为深度自回归精炼任务。与原始VAR训练程序使用的静态目标不同,作者的方法利用动态目标表述,可以实现模型自我精炼,并在训练过程中集
………………………………