通过Transformers用不同的采样方法生成文本

大淘宝技术 · 公众号 · · 2024-05-27 17:01

文章预览

近年来，随着以OpenAI的ChatGPT和Meta的LLaMA为代表的基于数百万网页数据训练的大型Transformer语言模型的兴起，开放域语言生成领域吸引了越来越多的关注。开放域中的条件语言生成效果令人印象深刻，典型的例子有：GPT2在独角兽话题上的精彩续写和XLNet等。促成这些进展的除了transformer架构的改进和大规模无监督训练数据外，更好的采样策略也发挥了不可或缺的作用。本文简述了不同的采样策略，同时向读者展示了如何使用流行的transformer库轻松实现这些采样策略！ LLM输出概率分布许多大型语言模型具有推理时（inference-time）参数，用于控制输出的“随机性”。这些参数通常是贪心搜索（Greedy search), 波束搜索(Beam search), Top-K采样(Top-K sampling), Top-p采样(Top-p sampling), 温度(Temperature)。 LLM 通常对一系列tokens进行操作，这些tokens可以是词、字符、子词(words, ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

青塔 · 牵头重组！理工大学，再添全国重点实验室

19 小时前

青塔 · 汇聚光电智慧，共创科研新篇 | 南开大学电子信息与光学工程学院诚邀英才

昨天

钱塘廉潮 · 中央办公厅负责人就《整治形式主义为基层减负若干规定》答记者问

5 月前

墨尔本微生活 · 燃爆 2025！墨尔本唐人街蛇年春节庆典活动，二十万人欢度，系列活动震撼来袭！

2 月前