专栏名称: 张铁蕾
老程序猿,全栈攻城狮,CTO,与你一起讨论技术干货和个人成长。
今天看啥  ›  专栏  ›  张铁蕾

DSPy下篇:兼论o1、Inference-time Compute和Reasoning

张铁蕾  · 公众号  ·  · 2024-12-16 08:37
    

文章预览

浮言易逝,唯有文字长存。 (今天继续聊聊AI技术) 约两周前,我用两篇文章介绍了DSPy的原理: 《 浅谈DSPy和自动化提示词工程(上) 》 《 浅谈DSPy和自动化提示词工程(中) 》 今天是第三篇,算是来完结一下这个话题。虽然DSPy在实用性上还存在非常多挑战,但是它的设计思想非常超前,也非常有意思。因此,现在我们结合AI领域的一些重要概念,做个思考总结。 技术方面的讨论 Training-time / Inference-time / Pre-inference time 在OpenAI的o1发布之后,业界开始关注 Inference-time Compute 。o1在inference的阶段,通过生成大量的reasoning tokens,来获得对于复杂问题的更强的推理能力(reasoning)。 Inference-time Compute这种说法,是相对于Training-time Compute来说的。并不是说o1不需要训练的算力,而是说,相对于以前的LLM来说,o1在inference阶段投入了更多的计算。这体现在,当 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览