文章预览
不知道你还是否记得首个「AI程序员」Devin,由10枚IOI金牌在手的创业团队Cognition AI开发,今年3月上线。 它由GPT-4提供后端支持,能以文本形式接收自然语言指令,并自主编写代码。 刚刚上线时,虽然效果没法达到取代程序员,但依旧给人留下了深刻印象。 如今,5个月过去,「狂飙」的GenAI领域已然大不相同。不仅GPT-4迎来了下一代模型GPT-4o,新发布的Claude 3.5 Sonnet、Codestral等模型都在编码方面性能优秀。 Devin的直接挑战者,是初创公司Cosine开发的自主AI工程师Genie。 Cosine发布的报告显示,在SWE-Bench中,Genie的得分为30.08%,轻松超越了分数为13.8%的Devin。 Cosine联合创始人兼CEO Alistair Pullen表示:「(Genie)模型的能力不是一个基准测试分数能概括的:它从一开始就被训练成像人类软件工程师(SWE)一样思考和行动。」 我很高兴与大家分享,我们打造出
………………………………