注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
黄建同学
·
Google AI 在Hugging ...
·
昨天
新智元
·
AI博士智能体自主科研,o1-preview ...
·
2 天前
宝玉xp
·
赞同,“智能”才是最关键的,交互是其次的-2 ...
·
2 天前
爱可可-爱生活
·
【[242星]Tipex:一款为Svelte ...
·
2 天前
爱可可-爱生活
·
【[1.3k星]开发者分享的多年使用Stri ...
·
2 天前
今天看啥
›
专栏
›
机器之心
国产推理大模型决战2025考研数学,看看谁第一个上岸?
机器之心
·
公众号
·
AI
· 2025-01-14 13:49
文章预览
机器之心发布 机器之心编辑部 随着上个月 2025 研究生考试的结束,最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」,将考验它们的深度思考能力。 业内曾有着这样一种共识:大语言模型在文字水平上的表现令人印象深刻,但说到数学就不甚令人满意了。去年一度火出圈的「9.9 与 9.11」比大小的问题,包括 GPT-4o 在内的很多大模型都翻车了,直到深度推理模型出现后才从根本上改善了这一状况。 OpenAI 发布的 o1 模型在涉及复杂和专业的数理问题方面表现让人印象深刻,大模型在经过一定时间仔细思忖后,回答问题的能力和准确度大幅提升,这种被称为推理侧 Scaling Law 的现象已经成为继续推动大模型能力提升的关键力量。在黄仁勋最新 CES 2025 的演讲中,他也把测试时(即推理)Scaling 形容为大模型发展的三条曲线之一。 可以看到, ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
黄建同学
·
Google AI 在Hugging Face 上发布了 Tim-20250113163533
昨天
新智元
·
AI博士智能体自主科研,o1-preview封神成本暴降84%!AMD霍普金斯新作爆火
2 天前
宝玉xp
·
赞同,“智能”才是最关键的,交互是其次的-20250113100939
2 天前
爱可可-爱生活
·
【[242星]Tipex:一款为SvelteKit量身打造的富文-20250112155701
2 天前
爱可可-爱生活
·
【[1.3k星]开发者分享的多年使用Stripe支付系统的经验总-20250112142436
2 天前
隆众资讯订阅号
·
丁二烯 | 行情探两年高点 短期供应仍显吃紧
7 月前
英特尔中国
·
基于至强® 6 能效核处理器的超聚变服务器操作系统FusionOS
7 月前
雪球
·
消费没行情,则股市无大牛,道理很简单,人们都没钱消费了,哪还有钱-20240626155041
6 月前
硅星人Pro
·
ICML直击丨包揽最佳论文、现场发offer抢人…学术顶会变成了“大厂”顶会
5 月前
证券时报
·
突发!“暂停所有石油出口”,这国刚刚宣布!油价直线拉升
4 月前