文章预览
点蓝色字关注 “机器学习算法工程师 ” 设为 星标 ,干货直达! OpenAI最大的对手公司AnthropicAI发布了最新模型Claude 3.5 Sonnet,它在各方面评测集上超过之前最大的模型Claude 3 Opus,但速度却提升了两倍,而且成本也只有后者的五分之一。 特别地,Claude 3.5 Sonnet在三个核心评测集GPQA、MMLU以及HumanEval上达到了新的SOTA,超过OpenAI的GPT-4o和GPT-4T,以及谷Google的Gemini 1.5 Pro。 Claude 3.5 Sonnet在编程能力上表现突出。 在一次内部的代理编码评估中,Claude 3.5 Sonnet 解决了64%的问题,表现优于解决了38%问题的Claude 3 Opus。 这个评估测试了模型在给定自然语言描述所需的改进后,修复错误或向开源代码库添加功能的能力。 当被指导并提供相关工具时,Claude 3.5 Sonnet 能够独立地编写、编辑和执行代码,具有复杂的推理和故障排除能力。 它轻松处理代码翻译,使其特别适
………………………………