专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
目录
相关文章推荐
今天看啥  ›  专栏  ›  斌叔OKmath

网页链接1/ 大型语言模型 (LLM) 真的可以推理吗?还是它们-20241012081511

斌叔OKmath  · 微博  ·  · 2024-10-12 08:15

文章预览

2024-10-12 08:15 本条微博链接 网页链接 1/ 大型语言模型 (LLM) 真的可以推理吗?还是它们只是复杂的模式匹配器?在我们的最新预印本中,我们通过对 Llama、Phi、Gemma 和 Mistral 等开源模型以及领先的封闭模型(包括最近的 OpenAI GPT-4o 和 o1 系列)的大规模研究来探索这一关键问题。 网页链接 2/ 大约 3 年前,OpenAI 发布 GSM8K 时,GPT-3(175B)在 GSM8K 测试中的得分为 35%。如今,具有约 3B 个参数的模型的得分超过 85%,而更大的模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览