今天看啥  ›  专栏  ›  人工智能前沿讲习

【综述专栏】视频语言如何建模?NUS最新《视频-语言理解:从模型架构、模型训练和数据角度》综述!!!

人工智能前沿讲习  · 公众号  ·  · 2024-06-13 11:00
    

文章预览

在 科 学 研 究 中 , 从 方 法 论 上 来 讲 , 都 应 “ 先 见 森 林 , 再 见 树 木 ” 。 当 前 , 人 工 智 能 学 术 研 究 方 兴 未 艾 , 技 术 迅 猛 发 展 , 可 谓 万 木 争 荣 , 日 新 月 异 。 对 于 A I 从 业 者 来 说 , 在 广 袤 的 知 识 森 林 中 , 系 统 梳 理 脉 络 , 才 能 更 好 地 把 握 趋 势 。 为 此 , 我 们 精 选 国 内 外 优 秀 的 综 述 文 章 , 开 辟 “ 综 述 专 栏 ” , 敬 请 关 注 。 人类使用多种感官来理解环境。视觉和语言是其中两个最重要的感官,因为它们使我们能够轻松地交流思想并感知周围的世界。近年来,人们对创建具有人类感官的视频-语言理解系统产生了浓厚的兴趣, 因为视频-语言对可以模拟我们的语言媒介和具有时间动态的视觉环境。在这篇综述中,我们回顾了这些系统的关键任务,并突出了相关的挑战 。基于这些 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览