专栏名称: AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
今天看啥  ›  专栏  ›  AI工程化

重磅消息:Claude 3.5 系列模型大更新及革命性增加计算机使用能力

AI工程化  · 公众号  ·  · 2024-10-23 00:49
    

文章预览

Anthropic 公司今日震撼发布了两款全新 AI 模型:Claude 3.5 Sonnet 和Claude 3.5 Haiku,同时推出了具有里程碑意义的计算机使用能力(beta 版)。这一系列创新不仅展示了 AI 技术的飞速进步,更预示着人机交互方式的重大变革。 Claude 3.5 Sonnet 作为升级版模型,在多个领域展现出显著的性能提升。特别是在编码能力方面,它在 SWE-bench Verified 基准测试中的表现从 33.4%跃升至 49.0%,远超其他公开可用模型,包括 OpenAI 的o1-preview 和专门设计用于代码生成的系统。 GitLab 在测试中发现,新模型在 DevSecOps 任务中的推理能力提升了 10%,且无额外延迟,使其成为驱动多步软件开发过程的理想选择。 作为 Anthropic 最快模型的下一代产品,Claude 3.5 Haiku 在保持原有成本和速度的基础上,全面提升了各项技能。它在 SWE-bench Verified 测试中得分 40.6%,超越了许多使用公开可用顶尖 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览