专栏名称: AI前线

InfoQ十年沉淀，为千万技术人打造的专属AI公众号。追踪技术新趋势，跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

爱可可-爱生活 · #转发赠书#携手@图灵新知 @图灵文化 ... · 7 小时前

字节跳动技术团队 · 无文本编码器仍能媲美CLIP！豆包大模型团队 ... · 2 天前

爱可可-爱生活 · 【Boltz-1：开源的生物分子相互作用模型 ... · 4 天前

宝玉xp · 回复@有很多os诶:对，Claude的Art ... · 5 天前

字节跳动技术团队 · 「会说话」的 AI ，扣子智能语音 ... · 6 天前

今天看啥 › 专栏 › AI前线

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

AI前线 · 公众号 · AI · 2024-11-17 13:30

文章预览

作者 | 马迎伟 / 明巍、黎槟华 / 临城、李永彬 / 水德解决真实 GitHub issue 能力进化，通义灵码团队最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》提出了面向程序改进的软件工程大模型通义灵码 SWE-GPT。「开源模型首次在 SWE-bench Verified 基准上自动解决超过 30% 的真实 GitHub issue」利用软件工程过程数据训练，在自动解决真实 issue 中首次接近闭源模型，展示了强大的软件修复和改进能力。概述 📔 随着 Devin 的发布，国内外 AI 程序员迅速发展，引起了产业界和学术界的广泛关注。AI 程序员通常利用 LLM-based agent 实现，称之为软件工程智能体（Software Engineering agent, SE agent）。 📐 SWE-bench 是一个用于评估软件工程智能体的权威 benchmark，评估 SE agent 在端到端软件维护（例如，修复软件问题）和演化（例如，添加新特性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · #转发赠书#携手@图灵新知 @图灵文化送出3本《万物皆计算》，-20241123101301

7 小时前

字节跳动技术团队 · 无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型

2 天前

字节跳动技术团队 · 无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型

2 天前

爱可可-爱生活 · 【Boltz-1：开源的生物分子相互作用模型，用于预测蛋白质、R-20241119141253

4 天前

宝玉xp · 回复@有很多os诶:对，Claude的Artifacts也不错的-20241118114058

5 天前

字节跳动技术团队 · 「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

6 天前

字节跳动技术团队 · 「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

6 天前

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

文章预览

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理