专栏名称: 算法爱好者
算法是程序员的内功!伯乐在线旗下账号「算法爱好者」专注分享算法相关文章、工具资源和算法题,帮程序员修炼内功。
今天看啥  ›  专栏  ›  算法爱好者

新王 Claude 3.5 实测:阿里数学竞赛题不给选项直接做对

算法爱好者  · 公众号  · 算法  · 2024-06-24 22:12
    

文章预览

↓ 推荐关注↓ 转自:量子位 | 公众号 QbitAI 新鲜出炉的 Claude 3.5 Sonnet ,更快、更便宜,还是全球最强。 在多个关键指标中,GPT-4o几乎被吊打! 网友对Claude 3.5 Sonnet和GPT-4o的横向实测似乎也印证了官方出炉的数据。 任务是同一个: 一句话,让它们帮忙复制网站的UI 。 测试者本人表示,GPT-4o这边,给了代码,但没有附加任何细节。 但Claude 3.5 Sonnet刷刷刷就出色完成了任务,甚至给了与这个网站设计相匹配的细节。 训练数据知识截止日期也更新到了2024年4月,网友实测知道今年2月的橄榄球超级碗比赛结果。 不过,这样的大模型新王,谁能忍住不第一时间试玩一波?反正好多网友坐不住了。不到12小时过去,全网对Claude 3.5 Sonnet的测评铺天盖地。 玩法也越来越刁钻,甚至有人用它重现1995年《黑客》中3D数据流的模型。 玩儿得太上头,又怕很快达到Claud ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览