专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

现在大部分宣称复刻Open AI o1的项目基本都是基于提示工程-20241008152752

歸藏的AI工具箱  · 微博  ·  · 2024-10-08 15:27
    

文章预览

2024-10-08 15:27 本条微博链接 现在大部分宣称复刻Open AI o1的项目基本都是基于提示工程和模型微调,没有一个是基于强化学习的。 #ai# Entropy-based sampling 这个项目看起来更有价值一些,虽然我也看不用太懂。 主要逻辑是基于熵的采样方法,用于改善大型语言模型(LLMs)的文本生成过程。 通过控制熵和方差熵来避免分布退化,提高生成结果的多样性和质量。 框架中,根据当前熵和方差熵的值,采取不同的策略,如贪心解 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览