专栏名称: 江大白
专业有趣的AI内容平台,关注后回复【算法】,获取45家大厂的《人工智能算法岗江湖武林秘籍》
今天看啥  ›  专栏  ›  江大白

3万字详细解析,各类大模型高效推理综述,清华大学最新工作发布!

江大白  · 公众号  ·  · 2024-06-06 08:00
    

文章预览

以下文章来源于微信公众号:深度学习与自然语言处理 作者:fanmetasy 链接:https://mp.weixin.qq.com/s/U9ESiWehnoKc9SnDz7DVKg 本文仅用于学术分享,如有侵权,请联系后台作删文处理 导读 大模型以其巨大的参数量换来了其前所未有的强大性能,这不可避免的带来了巨大的计算开销与推理耗时。本文针对大模型高效推理问题展开了全面的综述总结,赶快收藏慢慢看。 大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于高效大模型推理的文献进行了全面的综述总结。首先分析了大模型推理效率低下的主要原因,即大模型参数规模、注意力计算操的二次复杂度作和自回归解码方法。然后,引入了一个全 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览