MIT系初创打破Transformer霸权！非GPT架构首次显著超越Transformer

深度学习与NLP · 公众号 · · 2024-10-02 00:00

文章预览

来源 | 机器之心在大模型时代，谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而，刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。 Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的方法」。为了实现这一目标，Liquid AI 推出了其首批多模态 AI 模型：Liquid Foundation Models（LFM）。这是基于第一原理构建的新一代生成式 AI 模型，其 1B、3B 和 40B LFM 在各个规模上均能实现 SOTA 性能，同时保持更小的内存占用和更高效的推理。 Liquid AI 后训练主管 Maxime Labonne 在 X 上表示，LFM 是他职业生涯中最自豪的版本，LFM 的核心优势在于它们能够胜过基于 Transformer 的模型，同时占用更少的内存。有人表示，LFM 是 Transformer 的终结 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

上财金融学院职业发展CDC · 活动回顾 | 模拟面试工作坊：第四期

2 天前

上财金融学院职业发展CDC · 活动回顾 | 模拟面试工作坊：第四期

2 天前

雪球 · 【创业板指翻红此前一度跌近2%】指数探底回升，创业板指拉升翻红-20241113140401

2 天前

心禅道 · 比特币即将突破八万五美金，势不可挡！交易悟道后不下牌桌才是王道！

4 天前

心禅道 · 比特币即将突破八万五美金，势不可挡！交易悟道后不下牌桌才是王道！

4 天前

雪球 · 只有两个事情重要，第一个，公司利润要十年涨3倍。第二个，你要7%-20241111131402

5 天前

超前一步午后一股 · 周末发酵鑫机会！

5 天前

YNTV2都市条形码 · 傻眼！健身馆突然停业，买了上万元的课怎么办？律师解读

2 月前

LabGirls · 又被写基金索命一周，导师直接出绝招了!!

1 月前

江西民事审判 · 江西省高级人民法院民四庭关于租赁合同纠纷案件若干问题的观点解读

1 月前