专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

MIT系初创打破Transformer霸权！液体基础模型刷新SOTA，非GPT架构首次显著超越Transformer

新智元 · 公众号 · AI · 2024-10-01 13:10

主要观点总结

Liquid AI推出新一代生成式AI模型——液体基础模型LFM，该模型具有多种优势，包括高效内存、多模态功能、长文本处理能力等。

关键观点总结

关键观点1: LFM模型的特点和优势

LFM是首个基于液体神经网络（LNN）构建的模型，具有高效内存、多模态功能、长文本处理能力等。它可以在推理过程中进行实时调整，不会产生与传统模型相关的计算开销。LFM还提供了多种规模的选择，以适应不同的硬件和需求。

关键观点2: LFM与现有模型的不同之处

LFM不同于基于Transformer的模型，它通过探索构建超越生成式预训练Transformer（GPT）的基础模型的方法，实现了更高的性能和效率。LFM的核心是液体神经网络（LNN），这是一种受大脑启发的系统，具有适应性和鲁棒性。

关键观点3: 团队的研究背景和贡献

团队由MIT CSAIL的研究人员组成，他们在深度学习、神经网络和计算机视觉等领域做出了重要贡献。团队提出了液体神经网络（LNN）和一系列相关的技术和算法，这些技术和算法增强了模型的知识容量、推理能力和上下文记忆能力。

文章预览

新智元报道编辑：Aeneas 好困【新智元导读】就在刚刚，MIT系初创公司Liquid AI推出液体基础模型LFM，1B模型在基准测试中成为SOTA，这是非GPT架构首次显著超越Transformer模型！背后功臣，就是基于团队提出的液体神经网络（LNN）。就在刚刚，MIT系初创公司Liquid AI团队官宣：推出首批多模态非Transformer模型——液体基础模型LFM。作为通用人工智能模型，LFM可用于建模任何类型的顺序数据，包括视频、音频、文本、时间序列和信号。目前，LFM有三种不同的规模： 1.3B 的稠密模型，适用于资源高度受限的环境 3.1B 的稠密模型，为边缘部署进行了优化 40.3B 的混合专家（MoE）模型，专为处理更复杂的任务而设计在各种规模上，这三个模型都实现了最佳质量表现，同时保持了更小的内存占用和更高效的推理能力。公司的后训练主管Maxime Labonne表示，LFM是 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博