文章预览
MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation OpenAI危?!Claude已经超越GPT系列了?尤其在代码上... 文章封面梗图在最后~ 各种链接也在文末~ 近期在网络上一位知名记者的推文引起了广泛关注,他说在用AI辅助培训孩子编程时发现ChatGPT3.5比Claude 3.5 Sonnet差很多,而评论区有的人则说 感觉Claude 3.5 Sonnet比GPT-4o也好 ,恰好笔者翻到一条评论,这位用户的评论里提到了一篇前沿论文,这篇论文项目所构建的一个代码模型的排行榜恰好就印证了这位记者的真实用户体验。其实在Claude系列的新模型发布以来,一直有各种赞美的声音(真的很多我就不截图了,在X搜Claude+better关键词可以找到),我们不禁遐想Claude是不是真的已经在很多方面超越了GPT系列了! 我们好奇地点进这位用户的主页,发现他对这篇论文的细节做了更
………………………………