学术前沿 | Transformer究竟如何推理？基于样例还是基于规则

人工智能学家 · 公众号 · AI · 2024-07-02 15:14

文章预览

来源：北京大学人工智能研究院导读本文是对发表于 ICML 2024 的论文 Case-based or rule-based: How Do Transformers Do the Math? 的解读。文章第一作者为来自北京大学物理学院、即将加入人工智能研究院读博的胡逸。通讯作者为北京大学人工智能研究院助理教授张牧涵。论文地址：（点击下方阅读原文） https://arxiv.org/abs/2402.17709 项目主页: https://github.com/GraphPKU/Case_or_Rule 01 Case-based or rule-based? 尽管如 ChatGPT 这样的大语言模型（Large Language Models, LLMs）已经在各种复杂任务中展现出令人惊艳的性能，它们在处理一些对人类来说十分简单的数学推理问题时仍会面临困难，例如长整数加法。人类可以轻松地学习加法的基本规则，例如竖式加法，并将其应用于任意长度的新的加法问题，但 LLMs 却难以做到这一点。相反，它们可能会依赖于训练语料库中见过的相似 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 回复@赵小姐爱粉红:我反复试了几次，确实有些 URL 无法获取 -20250415123917

昨天

黄建同学 · 这AI效果Midjourney v7 + MagnificAI -20250414222007

2 天前

爱可可-爱生活 · 《爱可可微博热门分享(4.14)》爱可可微博热门分享(4.1-20250414222808

2 天前

黄建同学 · Vercel （v0的公司）最近花了不少工夫在AI SDK上，值-20250414182811

2 天前

新智元 · Gemini 2.5编程全球霸榜，谷歌重回AI王座！神秘模型曝光，奥特曼迎战

2 天前

贵州茅台 · 【致匠心】“空中标兵”牟光艳：用敬业绘就最美人生

6 月前

副业搞钱有术 · 游戏出海越南必看：提供越南游戏版号申请服务，越南本土团队交付！（1022更新）

5 月前

华尔街见闻 · 博通暴涨，市值突破1万亿美元！凭什么？

4 月前