NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台,通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
目录
相关文章推荐
IPRdaily  ·  新书见面 | ... ·  3 天前  
今天看啥  ›  专栏  ›  NVIDIA企业开发者社区

技术博客 | 使用 CUDA 图形优化 Llama.cpp AI 推理

NVIDIA企业开发者社区  · 公众号  ·  · 2024-08-15 16:38

文章预览

开源  llama.cpp  代码库最初于 2023 年发布,是一种轻量级但高效的框架,用于在 Meta Llama 模型上执行推理。llama.cpp 基于去年发布的  GGML  库构建,由于专注于 C/C++ 而无需复杂的依赖项,因此很快就吸引了许多用户和开发者(尤其是在个人工作站上使用)。 自首次发布以来,Llama.cpp 已得到扩展,不仅支持各种模型、量化等,还支持多个后端,包括支持 NVIDIA CUDA 的 GPU。在撰写本文之时, Llama.cpp 在所有 GitHub 库中排名第 123 位 ,在所有 C++ GitHub 库中排名第 11 位。 在 NVIDIA GPU 上使用 Llama.cpp 执行 AI 推理已经带来了显著的优势,因为它们能够以极高的性能和能效执行基础 AI 推理的计算,同时在消费设备和数据中心中也很普遍。NVIDIA 和 Llama.cpp 开发者社区继续合作,以进一步提高性能。本文介绍了最近通过在 Llama.cpp 中引入 CUDA Graphs 功能而实现的改进 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览