香港中文大学（深圳）团队推出混合 Mamba 和 Transformer 架构的大语言模型

科情智库 · 公众号 · · 2024-10-17 07:30

文章预览

科情智库近日，香港中文大学（深圳）和深圳大数据研究院的研究团队推出一种创新的混合架构多模态大语言模型LongLLaVA（长上下文大型语言和视觉助手），在效率和性能之间实现了更好的平衡。LongLLaVA的核心创新在于其混合架构，该架构结合了Mamba和Transformer模块，并提出了一种高效图像表示方法，该方法对图像Token应用2D池化以降低计算成本同时保持性能。在数据构建方面，LongLLaVA考虑了多个图像之间的时间和空间依赖性，设计了独特的数据格式，使模型能够区分图像之间的时间和空间关系。为了进一步提升模型的多模态长上下文处理能力，研究团队采用了渐进式训练策略。训练过程分为三个阶段：单图像对齐、单图像指令调整和多图像指令调整。通过这种逐步提升的方法，LongLLaVA在各种基准测试中取得了有竞争力的结果，并在单张80GB GPU上对10 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

我们都是担当人 · 中国财经出版传媒集团副总经理宋全安接受纪律审查和监察调查

昨天

我们都是担当人 · 中国财经出版传媒集团副总经理宋全安接受纪律审查和监察调查

昨天

终极较量 · 中方代表：十分失望，不可接受！

4 天前

政事儿 · 国足对战日本，官方发布文明观赛倡议

5 天前

终极较量 · 重大突破！正式入列

6 天前

育学园 · 5 种最常见早餐搭配，真不建议孩子天天吃！快看你家有没有

4 月前

指南针移民留学 · 谁说悉尼没有帅哥的？【第5届】新州留学生校草选拔赛火热报名中！上千刀现金大奖等你拿！

3 月前

Coherent高意 · Coherent高意首推L波段800G ZR/ZR+可插拔光模块

1 月前