文章预览
https://sites.google.com/view/v-lol V-LoL: A Diagnostic Dataset for Visual Logical Learning 摘要 尽管视觉人工智能的最新发展取得了成功,但仍存在不同的不足之处;从缺少精确的 逻辑推理,到抽象的泛化能力,再到理解复杂和嘈杂的场景 。不幸的是,现有的基准测试并未设计用于捕捉这些方面的多个方面。虽然 深度学习数据集侧重于视觉复杂的数据,但视觉推理任务简单 , 归纳逻辑数据集涉及复杂的逻辑学习任务,但缺乏视觉成分 。为了解决这个问题,我们提出了视觉逻辑学习数据集V-LoL,它 无缝地结合了视觉和逻辑挑战 。值得注意的是,我们介绍了V-LoL 的第一个实例,V-LoL ,这是 符号人工智能中经典基准测试Michalski火车问题的视觉版本 。通过在一个多功能框架中结合复杂的视觉场景和灵活的逻辑推理任务,V-LoL提供了一个平台,用于 调查广泛的视觉逻辑学
………………………………