专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
今天看啥  ›  专栏  ›  人工智能学家

学术前沿 | Transformer究竟如何推理?基于样例还是基于规则

人工智能学家  · 公众号  · AI  · 2024-07-02 15:14
    

文章预览

来源:北京大学人工智能研究院  导读  本文是对发表于 ICML 2024  的论文  Case-based or rule-based: How Do Transformers Do the Math?  的解读。文章第一作者为来自北京大学物理学院、即将加入人工智能研究院读博的胡逸。通讯作者为北京大学人工智能研究院助理教授张牧涵。 论文地址: (点击下方阅读原文) https://arxiv.org/abs/2402.17709 项目主页: https://github.com/GraphPKU/Case_or_Rule 01 Case-based or rule-based? 尽管如 ChatGPT 这样的大语言模型(Large Language Models, LLMs)已经在各种复杂任务中展现出令人惊艳的性能,它们在处理一些对人类来说十分简单的数学推理问题时仍会面临困难,例如长整数加法。 人类可以轻松地学习加法的基本规则,例如竖式加法,并将其应用于任意长度的新的加法问题,但 LLMs 却难以做到这一点。相反,它们可能会依赖于训练语料库中见过的相似 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览