注册
登录
专栏名称:
微软亚洲研究院
专注科研18年,盛产黑科技
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
宝玉xp
·
人家一个向程序员卖平台服务的当然这么说,巴不 ...
·
2 天前
爱可可-爱生活
·
[LG]《Model Balancing ...
·
4 天前
宝玉xp
·
这个万圣节的装扮不错,可以学起来来源:x.c ...
·
4 天前
爱可可-爱生活
·
【Cirkit:用于构建、学习和推理概率机器 ...
·
4 天前
黄建同学
·
这条提示我在midjourney试了下,生成 ...
·
5 天前
今天看啥
›
专栏
›
微软亚洲研究院
微软亚洲研究院多项创新技术,弥合大模型低比特量化与终端部署间鸿沟
微软亚洲研究院
·
公众号
·
AI
· 2024-08-20 17:01
文章预览
(本文阅读时间:14分钟) 编者按:在人工智能领域,模型参数的增多往往意味着性能的提升。但随着模型规模的扩大,其对终端设备的算力与内存需求也日益增加。低比特量化技术,由于可以大幅降低存储和计算成本并提升推理效率,已成为实现大模型在资源受限设备上高效运行的关键技术之一。然而,如果硬件设备不支持低比特量化后的数据模式,那么低比特量化的优势将无法发挥。 为了解决这一问题,微软亚洲研究院推出了全新的数据编译器 Ladder 和算法 T-MAC,使当前只支持对称精度计算的硬件能够直接运行混合精度矩阵乘法。测试结果表明,Ladder 在支持 GPU 原本不支持的自定义数据类型方面,最高提速可达14.6倍;T-MAC 在搭载了最新高通 Snapdragon X Elite 芯片组的 Surface AI PC 上,使 CPU 上运行的大模型吞吐率比专用加速器 NPU 快两倍。此外,研 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
宝玉xp
·
人家一个向程序员卖平台服务的当然这么说,巴不得人人都是程序员-20241019120937
2 天前
爱可可-爱生活
·
[LG]《Model Balancing Helps Low-d-20241018053700
4 天前
宝玉xp
·
这个万圣节的装扮不错,可以学起来来源:x.com/alsamah-20241018031445
4 天前
爱可可-爱生活
·
【Cirkit:用于构建、学习和推理概率机器学习模型的 Pyth-20241017135930
4 天前
黄建同学
·
这条提示我在midjourney试了下,生成的贴纸也非常不错!…-20241016193259
5 天前
蚂蚁景观
·
如何用三句话让你认识恭王府花园?
1 月前