专栏名称: 张俊林say
自然语言处理
今天看啥  ›  专栏  ›  张俊林say

如果是每个token做个action,然后做一次搜索,对于比较长-20240926090708

张俊林say  · 微博  ·  · 2024-09-26 09:07

文章预览

2024-09-26 09:07 本条微博链接 如果是每个token做个action,然后做一次搜索,对于比较长的hidden COT,这计算量感觉就太恐怖了,所以大概有一个抽象的action层级 这样指数级降低了计算量// @秋红爷 :好长,猜测蒙特卡洛搜索的单元不是token 而是一种定义的action ? Reverse-o1:OpenAI o1原理逆向工程图解 本文以相对容易理 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览