无损加速最高5x，EAGLE-2让RTX 3060的生成速度超过A100

机器之心 · 公众号 · AI · 2024-07-17 12:04

文章预览

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 李堉晖：北京大学智能学院硕士，受张弘扬老师和张超老师指导，研究方向为大模型加速和对齐，正在寻找25届工作机会魏芳芸：微软亚研院研究员，研究方向为具身智能、图像生成和AI agents 张超：北京大学智能学院研究员，研究方向为计算机视觉和机器学习张弘扬：滑铁卢大学计算机学院、向量研究院助理教授，研究方向为LLM加速和AI安全自回归解码已经成为了大语言模型（LLMs）的事实标准，大语言模型每次前向计算需要访问它全部的参数，但只能得到一个token，导 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · //@爱可可-爱生活：欢迎参与～-20241125073552

昨天

机器之心 · AI版周扒皮！打字速度慢、鼠标超30秒未动，就被AI「警告」，Karpathy下场评论

昨天

爱可可-爱生活 · 今日推介(第1597期)：通过移除全连接层来最小化Transfo-20241122062432

4 天前

宝玉xp · //@马少平THU:好精彩//@刘群MT-to-Death:编都-20241122070908

4 天前

黄建同学 · v0刚刚更新了根据截图生成 UI 的能力，变得更强大了！ #ai-20241121073600

5 天前

师妹财知道 · 见底的三个信号

4 月前

HR成长社 · 人家这才是面试提问，你那只是瞎唠嗑！

3 月前