文章预览
图片来源:由无界AI生成 不久之前,初创公司Cognition凭借其产品Devin震撼了人们。 这是第一个AI软件工程师,由OpenAI的GPT-4大语言模型驱动。Devin能够在自然语言文本指令下自主编写和编辑代码。 不过,Devin是在2024年3月推出的 —— 五个月前 —— 这在快速发展的生成式AI领域可以说是一个漫长的季节。 现在,另一家以“C”命名的初创公司Cosine,通过著名的Y Combinator初创加速器在旧金山成立,宣布推出了他们自己的全新自主AI工程师Genie。据称,Genie在第三方基准测试SWE-Bench上表现优异,得分30%,远超过Devin的13.8%,甚至超过亚马逊的Q和Factory的Code Droid的19%。 上图:Cosine 网站的截图展示了 Genie 在 SWE-Bench 上与其他 AI 编码工程师模型相比的表现。 “这个模型远不止一个基准测试分数(所能概括的):它从一开始就被训练得像一名人类软件工程师(SWE)
………………………………