解决 Transformer 根本缺陷，CoPE 论文爆火：所有大模型都能获得巨大改进！

深度学习基础与进阶 · 公众号 · · 2024-07-13 18:20

文章预览

转自 | 机器之心即使最强大的 LLM 也难以通过 token 索引来关注句子等概念，现在有办法了。最近两天，马斯克和 LeCun 的口水战妥妥成为大家的看点。这两位 AI 圈的名人你来我往，在推特（现为 X）上相互拆对方台。 LeCun 在宣传自家最新论文时，也不忘手动 @ 一把马斯克，并意味深长地嘱咐道：「马斯克，我们这项研究用来改善你家的 Grok 也没问题。」 LeCun 宣传的这篇论文题目为《 Contextual Position Encoding: Learning to Count What’s Important 》，来自 Meta 的 FAIR。骂战归骂战，这篇论文的重要性不言而喻。短短 24 小时之内就成为了 AI 领域最热门的论文之一。它有望解决如今大模型（LLM）最让人头疼的问题。论文地址：https://arxiv.org/pdf/2405.18719 总的来说，该研究提出了一种新的用于 transformer 的位置编码方法 CoPE（全称 Contextual Position Encoding），解决了标准 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

小白学视觉 · 哈工大硕士生用Python实现了11种数据降维算法，代码已开源！

3 月前

游理游据研究院 · 游戏公司2024半年报：*ST文投互联网游戏收入6826.34万元

2 月前

生信石头 · SCI论文润色/编辑-TBtools用户专属福利！

2 月前

潇湘晨报 · 长沙市民注意，这5条公交线路有变化

1 月前

杭州发布 · 大量上市！杭州街头出现排队大军！人手一根，炫到停不下来…

1 周前