专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

Cerebras 也来抢 Groq 的生意了,推出世界上最快的 -20240828154327

歸藏的AI工具箱  · 微博  ·  · 2024-08-28 15:43
    

文章预览

2024-08-28 15:43 本条微博链接 Cerebras 也来抢 Groq 的生意了,推出世界上最快的 LLM 推理服务。 #ai# Llama 3.1 8B 的生成数独可以到每秒1800Token,70B 可以达到 450 Token。 且价格更优,分别为每百万个Token 10 美分和 60 美分。 目前每个为每个开发者每天提供 100 万个免费 Token。 先搞个 API 家人们。 Cerebras 推理采用第三代 Wafer Scale Engine(WSE-3),它拥有 21 兆字节 / 秒的内存带宽,能够存储整个模型在芯片上,从而消除了外部内存的需 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览