今天看啥  ›  专栏  ›  AI for Research

Pixstral 12B多模态大模型论文上线!大模型内部词典的奥秘探索 | 大模型量化缩放规律...

AI for Research  · 公众号  ·  · 2024-10-10 22:29

文章预览

前言: 平淡无奇的一天又来了,今天要分享的内容主要是关于大模型、大语言模型、模型评估的,喜欢的小伙伴赶紧去阅读相关论文吧。 1. Pixstral 12B:一个拥有12亿参数的多模态语言模型   标题: Pixtral 12B   相关领域: 多模态   作者: Pravesh Agrawal,  Szymon Antoniak,  Emma Bou Hanna   分析: 这篇论文介绍了一个拥有12亿参数的多模态语言模型——Pixstral 12B。该模型经过训练能够理解自然图像和文档,在各种多模态基准测试中表现出卓越的性能,并且超越了更大的一些模型。Pixstral 12B使用一个全新的视觉编码器,可以摄取自然分辨率和长宽比的图像,为用户提供了处理图像时使用的令牌数量灵活性。此外,该模型还能在长上下文窗口(最多包含128K令牌)中处理任意数量的图像。总体而言,该论文展示了一个强大的多模态语言模型,它可以在保持自然 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览