专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
目录
相关文章推荐
今天看啥  ›  专栏  ›  DataFunSummit

NVIDIA大语言模型落地的全流程解析

DataFunSummit  · 公众号  ·  · 2024-10-02 18:00

文章预览

导读   本文将分享 NVIDIA 在大语言模型领域的解决方案。 包括三部分内容: 1.  第一部分是关于 NeMo Framework。NeMo Framework 是 NVIDIA 大语言模型的全栈解决方案,它通过不同组件完成生成式 AI 各个环节的任务,包括数据预处理、分布式训练、模型微调、模型推理加速及部署(TensorRT-LLM及Triton)、检索增强生成(RAG)、护栏技术(Guardrails)等等。 2.  第二部分是关于 TensorRT-LLM。TensorRT 从 2016 年推出以来,一直在不断发展。随着进入 AI 2.0 大语言模型时代,NVIDIA 隆重推出了 TensorRT-LLM。在 TensorRT 的基础上,TensorRT-LLM 对 LLM 部分进行了相应的封装和增强。一个令人振奋的消息是,TensorRT-LLM 是开源的,采用 Apache-2.0 开源协议,对用户非常友好。 3.   第三部分是关于 RAG(Retrieval Augmented Generation),即检索增强生成。在使用大语言模型时,存在一个问题,即模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览