今天看啥  ›  专栏  ›  晓飞的算法工程笔记

最新顶刊速递 [2024-09-02]

晓飞的算法工程笔记  · 公众号  ·  · 2024-09-02 10:11

文章预览

今日更新10篇: 计算机视觉 9篇 自然语言处理 1篇 如果你想增加某个领域或会议的收集,可以后台私信。 计算机视觉: 9篇 [0] See or Guess: Counterfactually Regularized Image Captioning[cs.CV] 标题:目睹或猜测:反事实正则化的图像标题生成 作者:Qian Cao, Xu Chen, Ruihua Song, Xiting Wang, Xinting Huang, Yuchen Ren 链接:http://arxiv.org/abs/2408.16809 摘要 :图像标题生成,即生成图像中视觉信息的自然语言描述,是视觉语言研究中的一个关键任务。以往模型通常通过在现有数据集上进行统计拟合,将机器的生成能力与人的智能相匹配来解决这一任务。虽然这些模型对于正常图像是有效的,但在描述某些部分被遮挡或编辑过的图像时,它们可能无法像人类那样准确地描述。这些模型表现出的弱点,包括幻觉和有限的可解释性,往往会在关联模式发生转变的情况下阻碍性能。在本文中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览