专栏名称: 硅谷科技评论
全球前沿科技,创业投资孵化。
今天看啥  ›  专栏  ›  硅谷科技评论

AI 模型系列之八:小模型

硅谷科技评论  · 公众号  ·  · 2024-07-24 14:30

文章预览

最近我们看到大量小型基础模型的发布,这些模型可以实现更低的成本和更低的延迟部署。该细分市场可以分为以下六类: 1、多语言 Mistral 和 NVIDIA 发布 Mistral NeMo,这是一种通用的12亿参数模型,支持十几种语言。 Cohere 的 Aya 系列也强调了强大的多语言能力。原始 Aya 模型于今年2月发布,支持101种语言。5月推出Aya 23,改进了 23 种语言的功能。 2、低成本 OpenAI 推出 GPT-4o-mini 模型,定价为每百万个输入代币15美分,每百万个输出代币60美分,比GPT-3.5 Turbo便宜超过60%。此外,还支持英语以外的编程语言和自然语言。 Anthropic 今年年初发布的 Claude 3 Haiku 模型,定价为每百万个输入代币25美分,每百万个输出代币125美分。 3、高质量 Hugging Face 推出 SmolLM 系列模型,分别为135M、360M和1.7B,其开发旨在通过对人类和合成生成的教育性教科书数据进行训练来 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览