文章预览
🚀 全球最快 AI 推理解决方案 🌏 Anthropic 全面开放 Artifacts AI 功能 👥 英伟达推出 NIM Agent Blueprints 服务 🌐 智谱 AI 开放 GLM-4-Flash 大模型 🛡️ 人脸隐私保护新方案 FaceObfuscator 💻 夸克全新 PC 端发布 🤝 日本金融巨头 SBI 与芯片创企 PFN 组建联盟 📈 燧原科技公司估值超 160 亿元 🦟 比尔・盖茨借助 AI 技术对抗疟疾 全球最快 AI 推理解决方案 Cerebras Systems 公司宣布推出 Cerebras Inference,被标榜为全球最快的 AI 推理解决方案。 Cerebras Inference 为 Llama 3.1 8B 模型提供每秒 1800 个 token 的处理速度,为 Llama 3.1 70B 模型提供每秒 450 个 token 的处理速度,速度是英伟达 GPU 方案的 20 倍。 Cerebras Inference 定价远低于流行的 GPU 云服务,起价为每百万个 token 10 美分,提供 100 倍的性价比。该方案采用 Cerebras CS-3 系统和 Wafer Scale Engine 3(WSE-3)AI 处理器,CS-3 的内存带宽是
………………………………