整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记,论文学习笔记和面试资料(关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭)
今天看啥  ›  专栏  ›  关于NLP那些你不知道的事

论文浅尝 | 基于多模态知识图的多模态推理(ACL2024)

关于NLP那些你不知道的事  · 公众号  ·  · 2024-10-16 07:00

文章预览

笔记整理:李冰慧,天津大学硕士,研究方向为大语言模型 论文链接:https://aclanthology.org/2024.acl-long.579/ 发表会议:ACL2024 1. 动机 使用大型语言模型( LLMs )的多模态推理经常会出现幻觉,并且在 LLMs 中存在缺乏或过时的知识。一些方法试图通过使用文本知识图来缓解这些问题,但它们的单一知识模态限制了全面的跨模态理解。 本文 提出了基于多模态知识图的多模态推理( MR-MKG )方法,该方法利用多模态知识图( MMKGs )跨模式学习丰富的语义知识,显著提高了 LLMs 的多模态推理能力。特别地,利用关系图注意网络对 MMKGs 进行编码,并设计了一个跨模态对齐模块来优化图像 - 文本对齐。构建了一个 MMKGgrait 数据集,通过预训练使 llm 具备多模态推理的初步专业知识。 2. 贡献 (1)本文是 第一个通过利用 MMKGs 衍生的知识来扩展 LLMs 的多模态推理能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览