文章预览
OpenAI最大的竞争对手Anthropic发布Claude 3.5新模型: 升级版的Claude 3.5 Sonnet和新模型Claude 3.5 Haiku。升级版的Claude 3.5 Sonnet在其前身的基础上全面提升,特别是在编码领域,它已经领先于该领域,现在更是取得了显著的进步。Claude 3.5 Haiku在许多评估中与我们的前最大模型Claude 3 Opus的性能相匹配,成本相同,速度与前一代Haiku相似。 其中更新版的Claude 3.5 Sonnet在行业标准测试中表现优异,特别是在编程和工具使用任务上有了显著提升。在编码测试SWE-bench Verified中,性能从33.4%提升至49.0%,超过了所有公开可用的模型。在代理工具使用测试TAU-bench中,零售领域的性能从62.6%提升至69.2%,航空领域的性能从36.0%提升至46.0%。此外,新模型与前代价格和速度相同。 而Claude 3.5 Haiku是最快的模型的下一代。与Claude 3 Haiku的成本相同,速度相似,Claude 3.5 Haiku在每项技能上
………………………………