专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理

AI前线  · 公众号  · AI  · 2024-11-17 13:30

文章预览

作者 | 马迎伟 / 明巍、黎槟华 / 临城、李永彬 / 水德 解决真实 GitHub issue 能力进化,通义灵码团队最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》提出了面向程序改进的软件工程大模型通义灵码 SWE-GPT。 「开源模型首次在 SWE-bench Verified 基准上自动解决超过 30% 的真实 GitHub issue」 利用软件工程过程数据训练,在自动解决真实 issue 中首次接近闭源模型,展示了强大的软件修复和改进能力。 概   述 📔 随着 Devin 的发布,国内外 AI 程序员迅速发展,引起了产业界和学术界的广泛关注。AI 程序员通常利用 LLM-based agent 实现,称之为软件工程智能体(Software Engineering agent, SE agent)。 📐 SWE-bench 是一个用于评估软件工程智能体的权威 benchmark,评估 SE agent 在端到端软件维护(例如,修复软件问题)和演化(例如,添加新特性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览