专栏名称: GiantPandaCV

专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创，每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你，大家一起共同进步(･ω<)☆

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大语言模型推理，用动画一看就懂！

GiantPandaCV · 公众号 · 3D · 2024-10-09 22:35

文章预览

这是《vLLM 深入浅出》系列的第一篇，用动画带你直观了解大语言模型推理的秘密，并解锁其中的三个核心挑战。大语言模型的推理过程假设输入的 prompt 是 "The future of AI is"，那么需要经历四个模块：Tokenizer、Model、Sampler、DeTokenizer。动画流程图如下： Tokenizer: 把人类的文本语言变成模型自己的语言： Token ，就是一串数字，是文本切分为多个单词后，每个单词对应的编号。Tokenizer 里有模型的词表，代表了模型认识哪些文本。 Model: 模型就像个预言家，根据你输入的内容，预测下一个词会是什么，这个预测结果叫做 logits 。它代表了模型预测的当前下一个词在词表里的概率，模型的第一次前向推理称之为 prefill（装填）阶段，而后续的前向推理称之为decode（解码）阶段。 Sampler: Sampler 就像从词表中抓阄，参考 logits 里指示的概率来选定下一个词 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博