|
如果是每个token做个action,然后做一次搜索,对于比较长-20240926090708 张俊林say · 微博 · · 1 月前 · 访问文章快照 |
|
o1是多个模型这是之前受到@宝玉xp 老师发的微博的启发,后来从-20240925124731 张俊林say · 微博 · · 1 月前 · 访问文章快照 |
|
Reverse-o1:OpenAI o1原理逆向工程图解本文以相-20240925085843 张俊林say · 微博 · · 1 月前 · 访问文章快照 |
|
感谢OpenAI o1,至少能给整个大模型行业续命一年啊,如果o-20240920191748 张俊林say · 微博 · · 2 月前 · 访问文章快照 |
|
来聊聊-20240920163732 张俊林say · 微博 · · 2 月前 · 访问文章快照 |
|
微博大量AI大模型岗位,欢迎投递简历! -20240920162708 张俊林say · 微博 · · 2 月前 · 访问文章快照 |
|
确实,路还很长,尽管目前有些题目o1仍然做不好,但是这个方向潜力-20240914084019 张俊林say · 微博 · · 2 月前 · 访问文章快照 |
|
蹭下热度谈谈OpenAI o1的价值意义及RL 的Scalin-20240913202232 张俊林say · 微博 · · 2 月前 · 访问文章快照 |
|
//@庆丰:热搜之外-20240812185657 张俊林say · 微博 · · 3 月前 · 访问文章快照 |
|
//@王巍:转发微博-20240809143933 张俊林say · 微博 · · 3 月前 · 访问文章快照 |
|
不用试中文不太行,其实405B的正确用法不是用来提供服务,而是用-20240725121843 张俊林say · 微博 · · 4 月前 · 访问文章快照 |
|
赶上应该差不多赶上了,不过中文效果似乎不太行,需要更好的中文化/-20240725080204 张俊林say · 微博 · · 4 月前 · 访问文章快照 |
|
LLama 3 405B模型效果已经赶上目前最好的闭源模型比如G-20240724201003 张俊林say · 微博 · · 4 月前 · 访问文章快照 |
|
就是,每个人都有在脑子里用语言思考问题的时刻,只是没有发出声而已-20240623115616 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
转发微博-20240622173421 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
第一次被人说洗稿,您仔细看下知乎高赞是啥,都是说是tokeniz-20240607191708 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
对啊,用不用工具不是重点,如果基础运算都不行,复杂逻辑能力何来?-20240607182331 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
回复@Aspirinrin:Scrachpad其实就是COT,只-20240607080900 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
回复@朱天赐ztc:很好的想法,已经用了,一般把这叫scratc-20240606213322 张俊林say · 微博 · · 5 月前 · 访问文章快照 |
|
这里以通俗易懂的方式来分析Sora的可能做法,包括它的整体结构以-20240320085955 张俊林say · 微博 · · 8 月前 · 访问文章快照 |