专栏名称: PaperAgent
日更,解读AI前沿技术热点Paper
目录
相关文章推荐
今天看啥  ›  专栏  ›  PaperAgent

通义灵码SWE-GPT:从静态代码建模迈向软件开发过程长链推理

PaperAgent  · 公众号  ·  · 2024-11-20 18:16

文章预览

解决真实GitHub issue能力进 化,通义灵码团队最新论文《 An Open Development-Process-Centric Language Model for Automated Software Improvement  》提出了面向程序改进的软件工程大模型通义灵码  SWE-GPT 「开源模型首次在SWE-bench Verified基准上自动解决超过30%的真实GitHub issue」 利用软件工程过程数据训练,在自动解决真实issue中首次接近闭源模型,展示了强大的软件修复和改进能力。 作者:马迎伟/明巍、黎槟华/临城、李永彬/水德 一、概述 📔 随着Devin的发布,国内外AI程序员迅速发展,引起了产业界和学术界的广泛关注。AI程序员通常利用LLM-based agent实现,称之为 软件工程智能体 (Software Engineering agent, SE agent)。 📐 SWE-bench是一个用于评估软件工程智能体的权威benchmark,评估SE agent在端到端软件维护(例如,修复软件问题)和演化(例如,添加新特性)方面 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览