专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

LLM实践系列—大模型的拒绝采样2

AINLP  · 公众号  ·  · 2024-11-08 17:28
    

文章预览

今天给大家带来知乎@真中合欢的大模型实践系列文章-LLM的拒绝采样。 作者:真中合欢  知乎:https://zhuanlan.zhihu.com/p/4547529049 拒绝采样是一种蒙特卡洛方法,和重要性采样一样,都是在原始分布难以采样时,用一个易于采样的建议分布进行采样。拒绝采样只是为了解决目标分布采样困难问题,它需要原始分布是已知的。形式描述是这样的: 假设已知原始分布为 ,但是从 采样较为困难,我们可以找到一个容易采样的建议分布 。再确定一个常数 ,确保任取x满足 。然后从 中采样,以 的概率保留这个样本,得到的采样结果就是服从 的样本。 对比来看看拒绝采样和重要性采样,重要性采样的目的是通过易采样的建议分布估算原始分布的期望,目的是为了数值计算,而拒绝采样是为了采样出一批样本。下面举个具体的拒绝采样的用例。 具体 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览