专栏名称: NVIDIA企业开发者社区

NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台，通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

技术博客 | 使用 CUDA 图形优化 Llama.cpp AI 推理

NVIDIA企业开发者社区 · 公众号 · · 2024-08-15 16:38

文章预览

开源 llama.cpp 代码库最初于 2023 年发布，是一种轻量级但高效的框架，用于在 Meta Llama 模型上执行推理。llama.cpp 基于去年发布的 GGML 库构建，由于专注于 C/C++ 而无需复杂的依赖项，因此很快就吸引了许多用户和开发者（尤其是在个人工作站上使用）。自首次发布以来，Llama.cpp 已得到扩展，不仅支持各种模型、量化等，还支持多个后端，包括支持 NVIDIA CUDA 的 GPU。在撰写本文之时， Llama.cpp 在所有 GitHub 库中排名第 123 位，在所有 C++ GitHub 库中排名第 11 位。在 NVIDIA GPU 上使用 Llama.cpp 执行 AI 推理已经带来了显著的优势，因为它们能够以极高的性能和能效执行基础 AI 推理的计算，同时在消费设备和数据中心中也很普遍。NVIDIA 和 Llama.cpp 开发者社区继续合作，以进一步提高性能。本文介绍了最近通过在 Llama.cpp 中引入 CUDA Graphs 功能而实现的改进 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博