文章预览
Cosine 人类推理实验室宣布推出 全球最佳 AI软件工程师Genie,旨在模拟人类工程师的认知过程,使其能够以前所未有的准确性和效率解决复杂问题 Genie 训练数据完美模拟了人类工程师的认知过程、逻辑和工作流程。专有技术生成的数据代表了完美的信息传递、渐进的知识发现和逐步决策。这使 Genie 能够突破其他 AI 软件工具所面临的限制,这些工具是围绕基础模型的包装,增加了一些额外的工具,如网络浏览器或代码解释器。Genie 能够解决未曾见过的问题,以与人类工程师相同的逻辑方式进行迭代和测试其输出 通过使用这种独特而复杂的数据集进行训练,而不是简单地提示基本模型(这是其他 AI 包装器的做法),可以观察到 Genie 正在像人类一样解决各种复杂、上下文相关的从未见过的问题 在 SWE-Bench 评估中Genie取得了 30.08% 的顶尖分数,在 SWE-Li
………………………………