文章预览
打造一个有温度、有趣味、专业的全栈式AI 交流社区, 用心写好每一篇文章! “ 近年来,多模态大语言模型得到了快速的发展。 然而, 这些视觉语言模型(VLM)中性能最好的仍然是闭源的,模型权重、数据和代码都没有公开发布。 当前基本上已经形成了OpenAI一家独大的局面。虽然GPT-4o和o1模型很牛逼,但是又有几个人能用得起?大模型是智能化时代的核心武器,它的能力应该赋能给所有人,而闭源在一定程度上会减缓这个进程。可喜的是,艾伦AI研究院将它们比肩Claude3.5的大模型开放了出来, 作者提出了Molmo(多模态开放语言模型)系列最先进的开放VLM,这些VLM具有已发布的模型权重和已发布的视觉语言训练数据,而不依赖于其它VLM(包括专有VLM)的合成数据。 这是一个新的VLM系列,在开放性方面处于最先进的水平。 Molmo家族中最好的incl
………………………………