通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

InfoQ · 公众号 · 科技媒体 · 2024-11-14 13:45

文章预览

作者 | 马迎伟 / 明巍、黎槟华 / 临城、李永彬 / 水德解决真实 GitHub issue 能力进化，通义灵码团队最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》提出了面向程序改进的软件工程大模型通义灵码 SWE-GPT。「开源模型首次在 SWE-bench Verified 基准上自动解决超过 30% 的真实 GitHub issue」利用软件工程过程数据训练，在自动解决真实 issue 中首次接近闭源模型，展示了强大的软件修复和改进能力。 1 概述 📔 随着 Devin 的发布，国内外 AI 程序员迅速发展，引起了产业界和学术界的广泛关注。AI 程序员通常利用 LLM-based agent 实现，称之为软件工程智能体（Software Engineering agent, SE agent）。 📐 SWE-bench 是一个用于评估软件工程智能体的权威 benchmark，评估 SE agent 在端到端软件维护（例如，修复软件问题）和演化（例如，添加新特性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【#小米第二款车或明年一季度上市#】据小米汽车内部人士透露：“小-20241121221008

16 小时前

新浪科技 · 【#拼多多发布2024年第三季度财报##拼多多第三季度营收不及预-20241121193210

18 小时前

新浪科技 · 【#Mate70系列样机到店##Mate70起售价或和60差不多-20241119084137

3 天前

新浪科技 · 【#广州全面放宽入户条件#】中新社广州11月18日电广州市发-20241118193000

3 天前

36氪 · 什么是纯电轿车的爆款公式？

5 天前

医学界 · 从最新荟萃分析看DPP-4i/二甲双胍联合治疗的有效性和安全性

1 月前

电动车公社 · 低调中带着杀气！中国车企在巴黎车展干了啥？

1 月前

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

文章预览

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理