专栏名称: CS的陋室
陋室,用知识装点。房主主要谈论与数学和计算机相关的知识,不定时推送和个人学习进度相关的知识,大数据时代,数学和计算机一个不能拉下。来一起学习和讨论吧!
今天看啥  ›  专栏  ›  CS的陋室

多模态大模型: 盘点&Highlights part1.5——从LLaVA-NeXT到LLaVA-OneVision

CS的陋室  · 公众号  ·  · 2024-08-25 21:00
    

文章预览

前言 Hi大家好,我叫延捷,是一名计算机视觉算法工程师,也是叉烧的老朋友了。 我们计划发布一系列关于多模态大模型的文章,帮助大家快速、精准地了解多模态大模型的前世今生,并且深 入各个多模态大模型领域优秀的工作,希望能给大家一个脉络性的盘点,一起学习,共同进步。 Hi大家好,我叫延捷,是一名计算机视觉算法工程师,也是叉烧的老朋友了。我们计划发布一系列关于多模态大模型的文章,帮助大家快速、精准地了解多模态大模型的前世今生,并且深入各个多模态大模型领域优秀的工作,希望能给大家一个脉络性的盘点,一起学习,共同进步。 Instruction 上一期我介绍了介绍下BLIP到LLaVA的一系列工作,关于LLaVA仅仅介绍到了LLaVA-NeXT,本期作为part1.5(也呼应了LLaVA-NeXT后续工作提出了1.5阶段训练^_^),我们顺着LLaVA这条线会细致介绍 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览