文章预览
今天, Anthropic最新推出的Claude 3.5 Sonnet模型在Amazon Bedrock正式上线 。升级版Claude 3.5 Sonnet获得了一项革命性的新技能: 能够像人类一样操作电脑。根据Anthrop ic介绍,该模型 各项能力均超越之前版本,实现了全面提升 ——尤其在代码方面,进一步巩固其行业领先地位。 Claude 3.5 Sonnet在业界基准测试中表现卓越,在SWE-bench Verified编码测试的得分由 33%跃升至49% ,超越所有目前公开可用的模型。在TAU-bench(评估模型灵活运用工具和API综合能力的基准测试)中,其零售领域得分从 62.6%提高到69.2% ,航空领域从 36.0%提高到46.0% 。性能全面提升的同时,Claude 3.5 Sonnet的成本与之前版本保持一致。 Claude 3.5 Sonnet新 增的“计算机使用”功能现已在Amazon Bedrock上线公测版 ,赋予使用者引导模型模拟人类行为进行屏幕观察、鼠标移动、点击以及文本输入等操作的能力
………………………………