今天看啥  ›  专栏  ›  爱可可爱生活

爱可可 AI 前沿推介(5.18)

爱可可爱生活  · 公众号  ·  · 2024-05-18 06:40
    

文章预览

LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 RO - 机器人 1、[CL] Chameleon:Mixed-Modal Early-Fusion Foundation Models 2、[LG] LoRA Learns Less and Forgets Less 3、[CV] CAT3D:Create Anything in 3D with Multi-View Diffusion Models 4、[IR] UniRAG:Universal Retrieval Augmentation for Multi-Modal Large Language Models 5、[CV] Toon3D:Seeing Cartoons from a New Perspective 摘要:混合模态早期融合基础模型、LoRA学得少忘得也少、用多视图扩散模型在3D中创建任意东西、多模态大语言模型的通用检索增强、换个视角看卡通结构重建 1、[CL] Chameleon: Mixed-Modal Early-Fusion Foundation Models C Team [FAIR at Meta] Chameleon:混合模态早期融合基础模型 要点: 提出Chameleon, 一系列基于early-fusion token的混合模态模型,能理解和生成任意顺序的图像和文本。 Chameleon使用统一的架构,将图像和文本都表示为离散的token,从而实现跨模态的无缝推理, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览