使用 Optimum-Intel 和 OpenVINO GenAI 优化和部署模型

Hugging Face · 公众号 · · 2024-10-21 10:30

文章预览

在端侧部署 Transformer 模型需要仔细考虑性能和兼容性。Python 虽然功能强大，但对于部署来说有时并不算理想，特别是在由 C++ 主导的环境中。这篇博客将指导您如何使用 Optimum-Intel 和 OpenVINO™ GenAI 来优化和部署 Hugging Face Transformers 模型，确保在最小依赖性的情况下进行高效的 AI 推理。为什么使用 OpenVINO 来进行端侧部署 OpenVINO™ 最初是作为 C++ AI 推理解决方案开发的，使其非常适合在端侧设备部署中，其中最小化依赖性至关重要。随着引入 GenAI API，将大型语言模型 (LLMs) 集成到 C++ 或 Python 应用程序中变得更加简单，其特性旨在简化部署并提升性能。第一步: 创建环境预先准备开始之前，请确保您的环境已正确配置了 Python 和 C++。安装必要的 Python 包: pip install --upgrade --upgrade-strategy eager optimum[openvino] 以下是本文中使用的具体包: transformers==4.44 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

国芯网 · 半导体精品公众号推荐！

3 天前

国芯网 · 半导体精品公众号推荐！

3 天前

投资界 · 无锡，诞生今年首个超级独角兽

3 天前

半导体行业联盟 · 中微董事长尹志尧：我家里三代人都回国报效！

4 天前

半导体行业联盟 · 雷军晒照，小米入局！

4 天前

四川日报 · 油罐车混拉食用油？央视网怒批：形同投毒！

6 月前

新金融法 · 控制权交易中的股东权利和议价结构

2 月前

东莞本地宝 · 东莞将再添两所公办学校！

1 周前