注册登录

专栏名称: NewBeeNLP

一个自然语言处理&人工智能的原创杂货铺子，希望能找到你喜欢的小玩意儿

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

为你读诗 · 生活朝我丢泥巴，我拿泥巴种鲜花 · 昨天

Linux就该这么学 · 如何用 Linux 权限管理打造无懈可击的系统？ · 2 天前

文学音乐与朗诵 · 跌倒了，爬起来 · 3 天前

今天看啥 › 专栏 › NewBeeNLP

大语言模型：数学推理优化

NewBeeNLP · 公众号 · · 2024-09-02 11:05

文章预览

导读本文将分享如何提升大模型的数学推理能力。我们没有把数学推理能力与翻译、长文本生成等专项分开优化，而是视为通用能力的一部分。因为我们认为数学推理能力是衡量大模型智能水平的关键指标。主要内容包括以下五个部分： 1. 大语言模型概述 2. 混合指令 3. 合成数据 4. 训练优化 5. 问答环节分享嘉宾｜文亮奇虎360 资深算法专家出品社区｜ DataFun 01 大语言模型概述首先来回顾一下大模型的基本结构。上图中列出了当前一些主流大模型，比如 GPT 系列中的 GPT-3，发布于 2020 年，拥有 175B 参数，还有 Huggingface 的 Bloom、清华的 GLM 系列、Meta 的 LLaMA、百川的 Baichuan 和阿里的 Qwen 系列等等。除了清华的 GLM 使用的是 Prefix decoder，这些模型大多采用与 GPT 类似的架构。这些模型的参数规模各不相同。GLM 系列除了最大 130B 的模型外 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

为你读诗 · 生活朝我丢泥巴，我拿泥巴种鲜花

昨天

Linux就该这么学 · 如何用 Linux 权限管理打造无懈可击的系统？

2 天前

文学音乐与朗诵 · 跌倒了，爬起来

3 天前

健康鄂尔多斯官方 · 食品安全宣传周 | 夏季食品安全指南来了→

8 月前

事考必过 · 公基轻松学 |《地理常识中的地理之最》考点清单+重要试题+音频讲解(08.05)

6 月前

国际科学 · 最佳延寿运动来了！中山大学发现，剧烈运动、久坐加速衰老，而这种运动抗衰效果最佳

5 月前

生信学霸 · IF14.7，最快4天内回复，口碑硬，一区TOP神经科学类期刊——Neuron

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号