【KDD2024】基础模型在AI加速器上的推理优化

数据派THU · 公众号 · 大数据 · 2024-07-23 17:00

文章预览

来源：专知本文为论文介绍，建议阅读 5 分钟我们的教程提供了关于使用AI加速器进行推理优化的全面讨论。强大的基础模型，包括具有Transformer架构的大型语言模型（LLMs），在各个行业引领了生成式人工智能的新纪元。基础模型的出现催生了大量新应用，这些应用涵盖了问答系统、客户服务、图像和视频生成以及代码补全等多个领域。然而，当模型参数数量达到数千亿时，在现实场景中的部署会带来高昂的推理成本和高延迟。因此，业界对使用AI加速器进行成本效益高且快速推理的需求越来越高。为此，我们的教程提供了关于使用AI加速器进行推理优化的全面讨论。首先，我们概述了基本的Transformer架构和深度学习系统框架，然后深入探讨了用于快速和内存高效的注意力计算的系统优化技术，并讨论了这些技术如何高效地在AI加速器上实现。接 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

大数据文摘 · 与 Open AI 分手后，Figure 推出具身模型 Helix，多个机器人一同做家务

3 天前

数据派THU · 数据派志愿者招募 | 寻找最志同道合的你！

3 天前

科创板日报 · 先进封装又一选择！英伟达GB200提前导入FOPLP技术

9 月前

国脉物联网 · 我国智能制造装备行业现状及未来发展趋势

8 月前

中国音乐ChineseMusic · 重要通知｜“中国音乐期刊网·预印本平台”可自主发布学位论文及博士后出站报告

5 月前

生物与医药考研(微博搜索) · 生物与医药考研(微博搜索)-20250223-1

3 天前