注册
登录
专栏名称:
量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
宝玉xp
·
我以前在国内看病的时候,就发现医生看完检查报 ...
·
昨天
宝玉xp
·
Gemini 也有推理模型了,在 ai ...
·
3 天前
爱可可-爱生活
·
【Midscene.js:一款AI驱动的自动 ...
·
4 天前
爱可可-爱生活
·
【Forked:Swift中管理共享资源并发 ...
·
4 天前
宝玉xp
·
ChatGPT Team ...
·
4 天前
今天看啥
›
专栏
›
量子位
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快
量子位
·
公众号
·
AI
· 2024-07-07 21:06
文章预览
蔡泽凡 投稿 量子位 | 公众号 QbitAI 批评不仅能让人进步,也能让大模型的能力提升。 OpenAI就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在CriticGPT放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。 在无需训练的设置下,验证 器能够在推理时辅助模型在GSM8K上的准确率从86.6%提升到88.2%。 在GSM8K数据集上,它可以让模型的准确率从86.6%提升到88.2%。 CriticGPT的核心思路是在代码中故意设置bug并进行详细标注,然后用得到的数据训练出会debug的模型。 北大团队发现,这种方法不仅在代码当中有用, 也能帮助语言模型解决数学问题 。 于是团队利用相似的思路,把代码换成数学问题,推出了“数学版CriticGPT”—— Math-Minos 。 用GPT4逐步提出修正意见 在数学推理领域, 验证解决方案的正确性 ,是确保推理质量 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
宝玉xp
·
我以前在国内看病的时候,就发现医生看完检查报告现场用电脑在百度搜-20241222005148
昨天
宝玉xp
·
Gemini 也有推理模型了,在 ai studio 可以试用。-20241220011017
3 天前
爱可可-爱生活
·
【Midscene.js:一款AI驱动的自动化软件开发工具包,能-20241219134303
4 天前
爱可可-爱生活
·
【Forked:Swift中管理共享资源并发访问的自信助手,无需-20241219134949
4 天前
宝玉xp
·
ChatGPT Team 订阅用户现在也能用 Sora 了! -20241219133312
4 天前