文章预览
AIGC Research < PaperDaily> 主编 | 庄才林(Cailin Zhuang) 技术支持 |胡耀淇(Yaoqi Hu) 发布日期 |2024年 10月 23 日| 周三 Topic: Image Generation|Captioning Altogether: Image Captioning via Re-aligning Alt-text 2024-10-22|Meta FAIR, U Washington, NYU|EMNLP 2024|⭐️ http://arxiv.org/abs/2410.17251v1 https://github.com/facebookresearch/MetaCLIP 概述 本文提出了一种名为“Altogether”的 图像标题/描述生成方法,旨在通过重新对齐现有的替代文本(alt-text)来提升图像标题的质量 。现有的图像标题生成方法通常忽视替代文本的潜在信息,且缺乏透明度,导致生成的标题缺乏细节和准确性。本文的方法通过对现有的替代文本进行多轮人类注释和重新对齐,生成更加丰富的图像描述。该研究展示了通过这种方法生成的标题在图像内容与文本内容之间的相关性和准确性上有显著提升。最终,作者通过多
………………………………