文章预览
点击上方 蓝字 关注我 本文:6100字阅读 15分钟 传统的方法,我们往往只给大语言模型一次机会来解决问题。但假如我们给予模型多次尝试的机会,会发生什么呢?不要忽视重复尝试的力量。只要次数足够多,总能得到正确的的答案。 斯坦福大学、牛津大学和谷歌Deepmind的研究人员三天前提出了一个简单而有力的想法:让模型反复尝试,直到得到正确答案。这个方法被称为"重复采样"(repeated sampling)。这个想法虽然简单,但效果却出人意料的好。研究表明,通过增加采样次数,即使是相对较弱的模型也能在多个任务上超越更强大模型的单次尝试表现。 这项研究的灵感来自于著名的"无限猴子定理":如果让一只猴子在打字机上随机按键足够长的时间,它最终会打出莎士比亚的全部作品。虽然这个定理听起来有些荒谬,但它揭示了一个深刻的真理:只
………………………………