专栏名称: 程序员好物馆
成就一亿技术人
今天看啥  ›  专栏  ›  程序员好物馆

解决真实GitHub Issue能力一度登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

程序员好物馆  · 公众号  ·  · 2024-11-13 09:00

文章预览

作者 | 豆包MarsCode团队 投稿        责编 | 梦依丹 解决真实 GitHub Issue 的基准测试,字节家的豆包MarsCode Agent 悄悄登顶了。 SWE-Bench,一个由普林斯顿大学提出的极具挑战性的 Benchmark,近期受到工业界、学术界和创业团队的广泛关注。 在其子集 SWE-Bench Lite 排行榜上,豆包MarsCode Agent 近期一度冲上第一(10月23日榜单)。 虽然这是面向所有大模型解决方案的评测,但现在排名靠前的部分已基本被 AI Agent 占领。 AI Agent 即能够感知外部环境、操作工具并具有一定自主决策能力的智能体,受到了越来越多的研究关注。 现在,豆包MarsCode Agent 团队分享了在软件工程领域进行了一系列关于 AI Agent 应用的探索和尝试: 通过构建 Agent 框架并为其提供代码检索、调试和编辑的交互接口和工具,使得 Agent 有可能接管部分软件工程开发任务。 在 Agent 框架方面,他们 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览