文章预览
2022 年,一个叫 Jason Wei 的中国科学家,在一篇文章里首次提出了一个新观点:他认为,通过一种叫做 CoT(思维链) 的方法,可以让大型语言模型(LLM)在思考问题时,变得更加聪明和有逻辑。 但是即便有了 CoT(思维链) ,LLM 有时候还是会犯错。 去年,来自普林斯顿大学和 Google DeepMind 研究人员提出了一种全新的语言模型推理框架 -- ToT(思维树) 。 该框架针对 CoT(思维链) 进行了总结,引导大语言模型利用思维作为中间步骤来解决通用问题,从而解锁了更复杂的推理方式和更高质量的输出结果。 论文地址:https://arxiv.org/abs/2305.10601 ToT(思维树) 到底有什么价值呢? 它可以让大模型: 自行想出好几种不同的解决办法; 仔细比较这些办法,挑出最好的一个; 如果发现走错了路,能及时回头,重新选择正确的方向。 通过一句话来总结
………………………………