注册登录

专栏名称: PaperAgent

日更，解读AI前沿技术热点Paper

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

青岛新闻网 · 每人奖励1万元，网友：排面拉满 · 3 小时前

阳泉日报 · 赶快收藏！山西古建筑地图面世 · 4 天前

阳泉日报 · 赶快收藏！山西古建筑地图面世 · 4 天前

今天看啥 › 专栏 › PaperAgent

通义灵码SWE-GPT：从静态代码建模迈向软件开发过程长链推理

PaperAgent · 公众号 · · 2024-11-20 18:16

文章预览

解决真实GitHub issue能力进化，通义灵码团队最新论文《 An Open Development-Process-Centric Language Model for Automated Software Improvement 》提出了面向程序改进的软件工程大模型通义灵码 SWE-GPT 「开源模型首次在SWE-bench Verified基准上自动解决超过30%的真实GitHub issue」利用软件工程过程数据训练，在自动解决真实issue中首次接近闭源模型，展示了强大的软件修复和改进能力。作者：马迎伟/明巍、黎槟华/临城、李永彬/水德一、概述 📔 随着Devin的发布，国内外AI程序员迅速发展，引起了产业界和学术界的广泛关注。AI程序员通常利用LLM-based agent实现，称之为软件工程智能体（Software Engineering agent, SE agent）。 📐 SWE-bench是一个用于评估软件工程智能体的权威benchmark，评估SE agent在端到端软件维护（例如，修复软件问题）和演化（例如，添加新特性）方面 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

青岛新闻网 · 每人奖励1万元，网友：排面拉满

3 小时前

阳泉日报 · 赶快收藏！山西古建筑地图面世

4 天前

阳泉日报 · 赶快收藏！山西古建筑地图面世

4 天前

自动驾驶之星 · 端到端自动驾驶必要模块在线建图——MonLaneMapping_c++复现

7 月前

IPRdaily · 涉及知识产权代理，重点打击这4种行为｜《深化“蓝天”行动促进知识产权代理行业高质量发展细化方案》全文发布

7 月前

走出去情报 · 中电工程国际公司中标毛里塔尼亚225kV输变电项目

6 月前

浙江电力交易中心有限公司 · “e-交易”全新升级实现电力交易核心业务移动端全覆盖

6 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号