专栏名称: 动物精神AnimalSpirit
曾在革命之路上匍匐,也成为过凯恩斯的信徒。宏观为引,量化做酒,愿天下英雄共一醉。
今天看啥  ›  专栏  ›  动物精神AnimalSpirit

Recurrent Ideas 2: 种一颗小草莓

动物精神AnimalSpirit  · 公众号  ·  · 2024-09-13 18:03
    

文章预览

0. 背景 之前在chatGPT横空出世的时候,我们写了个文章《Reflections on Transformers》,展示了我们的尝试。今天o1出来了, 我们也想展示一下这一年过程中我们新的尝试——让一个大语言模型学会推理,以面对长程、开放式的任务。 REALM是我们的AI基座模型,过去的一年中,我们使用了包括RL在内的各种方法来强化它进行深度推理与思考的能力。我们先demo演示当前模型的能力: 问题:prove the lemma that n-th order polynomials on Z/p, where p is a prime, has at most n roots. 模型答案: Plan 1: Direct Proof via Polynomial Division 1. Assume a polynomial has more than n roots. 2. Choose n+1 distinct roots. 3. Construct a polynomial of degree n using these roots (e.g., using the product of linear factors). 4. Divide the original polynomial by this constructed polynomial. Show that the remainder must be zero, leading to a contradiction. ---------------------------------- ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览