注册登录

专栏名称: AI工程化

专注于AI领域（大模型、MLOPS/LLMOPS 、AI应用开发、AI infra）前沿产品技术信息和实践经验分享。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

青岛日报 · 山东最新通知！要给这些人发钱了 · 5 小时前

鲁中晨报 · 确定了！3月8日起，连续2个周末！高青、博山都有 · 2 天前

今天看啥 › 专栏 › AI工程化

KTransformers：让DeepSeek加速28倍的国产推理框架

AI工程化 · 公众号 · · 2025-02-14 07:05

文章预览

今天介绍一款国产的推理加速框架，它让deepseek的推理速度又上一个档次。它就是由清华大学 MADSys 团队和 Approaching.AI 共同开发一个新项目KTransformers(Quick Transformers)，它是一个基于 Python 的框架，专注于提升 Hugging Face Transformers 的使用体验。它通过先进的内核优化和并行策略，显著提高 LLM 的推理速度。 KTransformers 具有高度的灵活性和可扩展性，允许用户通过简单的代码注入，集成优化的模块，并提供 Transformers 兼容的接口、兼容 OpenAI 和 Ollama 的 RESTful API，以及一个简化的 ChatGPT 风格的 Web UI。 KTransformers 的性能优化基本囊括了目前主流的优化手段，包括：内核优化：通过注入优化的内核（如 Llamafile 和 Marlin），替换 PyTorch 原生模块，从而提高计算效率。这些内核针对特定硬件和数据类型进行了深度优化。量化技术：支持模型量化，将模型权重从 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

青岛日报 · 山东最新通知！要给这些人发钱了

5 小时前

鲁中晨报 · 确定了！3月8日起，连续2个周末！高青、博山都有

2 天前

光伏們 · 0.758-0.79元/瓦！一道、协鑫、正泰入围8MW光伏组件集采

7 月前

自然系列 · 国际会议邀请 |【2024浦江创新论坛】“神经科技创新论坛：脑、心智与神经技术”会议注册开启！

5 月前

新材料在线 · 100大最具潜力新材料市场预测及发展趋势

3 月前

金昌市场监管 · 我省14批次药品不符合标准规定！

1 月前

环保人 · 危废库面积增加30%以上算重大变动吗？请看环境部文件明确规定

1 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号