专栏名称: 十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
今天看啥  ›  专栏  ›  十字路口Crossing

全球最快 AI 推理解决方案:狂飙英伟达 20 倍

十字路口Crossing  · 公众号  ·  · 2024-08-28 23:15

文章预览

🚀 全球最快 AI 推理解决方案 🌏 Anthropic 全面开放 Artifacts AI 功能 👥 英伟达推出 NIM Agent Blueprints 服务 🌐 智谱 AI 开放 GLM-4-Flash 大模型 🛡️ 人脸隐私保护新方案 FaceObfuscator 💻 夸克全新 PC 端发布 🤝 日本金融巨头 SBI 与芯片创企 PFN 组建联盟 📈 燧原科技公司估值超 160 亿元 🦟 比尔・盖茨借助 AI 技术对抗疟疾 全球最快 AI 推理解决方案 Cerebras Systems 公司宣布推出 Cerebras Inference,被标榜为全球最快的 AI 推理解决方案。 Cerebras Inference 为 Llama 3.1 8B 模型提供每秒 1800 个 token 的处理速度,为 Llama 3.1 70B 模型提供每秒 450 个 token 的处理速度,速度是英伟达 GPU 方案的 20 倍。 Cerebras Inference 定价远低于流行的 GPU 云服务,起价为每百万个 token 10 美分,提供 100 倍的性价比。该方案采用 Cerebras CS-3 系统和 Wafer Scale Engine 3(WSE-3)AI 处理器,CS-3 的内存带宽是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览