文章预览
Anthropic终于发布新模型了,那个本该在去年11月前就出来的模型,也许本来因为一些技术原因造成了延迟,也许自从OpenAI的o3发布后,就一直在憋大招。当然,也许因为Deepseek R1的发布,让Anthropic迎来了“顿悟”时刻,然后,就也有了它的思考模型。 勤奋的朋友们在发消息问我:是不是低于预期? 我早上起来后,快速尝试了几个在手的例子,然后回答:版本号叫3.7,肯定是低于预期的,因为市场预期叫做“Claude-4”。但是,实际表现进步是很明显的。 这次发布了两个3.7,一个是Claude3.7 Sonnet,基础模型,另一个是Claude3.7 Sonnet(64K Extend Thinking),思考模型。 正好把前几天在准备的“预测下一词”动画演示拿出来溜溜。 提示词如下: compile an animation to illustrate why llm's secret is just to predict the next token, please include transformer, multiple attentions, using a professional t
………………………………