今天看啥  ›  专栏  ›  晓飞的算法工程笔记

One-for-All:上交大提出视觉推理的符号化与逻辑推理分离的新范式 | ECCV 2024

晓飞的算法工程笔记  · 公众号  ·  · 2024-08-08 08:56

文章预览

通过对多样化基准的严格评估,论文展示了现有特定方法在实现跨领域推理以及其偏向于数据偏差拟合方面的缺陷。从两阶段的视角重新审视视觉推理:( 1 )符号化和( 2 )基于符号或其表示的逻辑推理,发现推理阶段比符号化更擅长泛化。因此,更高效的做法是通过为不同数据领域使用分离的编码器来实现符号化,同时使用共享的推理器。 来源:晓飞的算法工程笔记 公众号 论文: Take A Step Back: Rethinking the Two Stages in Visual Reasoning 论文地址:https://arxiv.org/abs/2407.19666 论文代码:https://mybearyzhang.github.io/projects/TwoStageReason Introduction   推理能力是人类智能的集中体现,它是概念形成、对世界的认知理解以及与环境交互的基础。具体而言,视觉推理作为人类获取信息和理解的主要方式之一,已经成为广泛研究的焦点。近年来,随着深度学习的进步,涌 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览