专栏名称: 大语言模型和具身智体及自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

沈阳网 · 事发沈北！刘某强，被沈阳警方刑拘！ · 昨天

贵州法治报 · 警方通报“19岁女生被顺风车司机高速上拖拽下 ... · 昨天

平安湛江 · 守正创新110 协同高效护安宁 · 昨天

防骗大数据 · 代为签约，强制扣款！“先享后付”消费陷阱套路深！ · 3 天前

重庆晨报 · 讣告！一级演员今晨逝世，享年90岁 · 3 天前

今天看啥 › 专栏 › 大语言模型和具身智体及自动驾驶

基于通信智体增强 LLM 代码调试能力

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-08-18 00:10

文章预览

24年8月来自东北大学的论文“Enhancing the Code Debugging Ability of LLMs via Communicative Agent Based Data Refinement”。调试是软件开发中的重要方面，但大语言模型 (LLM) 的调试能力仍未得到充分开发。DEBUGEVAL 是一个旨在评估 LLM 调试能力的综合基准测试。DEBUGEVAL 从现有的高质量数据集中收集数据，并设计四个不同的任务来评估调试效果，包括 BUG 定位、BUG 识别、代码审查和代码修复。此外，为了增强 LLM 的代码调试能力，提出一种基于通信智体的数据细化框架 ( MASTER，coMmunicative Agent baSed daTa rEfinement fRamework )，该框架生成细化的代码调试数据，供有监督的微调。具体而言，MASTER 使用 Code Quizzer 根据 DEBUGEVAL 定义的任务生成细化数据。然后， Code Learner 充当一个批评者Critic并保留其无法解决的生成问题。最后， Code Teacher 提供基于思维链（CoT）的详细解决方案来 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

沈阳网 · 事发沈北！刘某强，被沈阳警方刑拘！

昨天

贵州法治报 · 警方通报“19岁女生被顺风车司机高速上拖拽下车”：司机李某某被行拘！详情公布

昨天

贵州法治报 · 警方通报“19岁女生被顺风车司机高速上拖拽下车”：司机李某某被行拘！详情公布

昨天

平安湛江 · 守正创新110 协同高效护安宁

昨天

防骗大数据 · 代为签约，强制扣款！“先享后付”消费陷阱套路深！

3 天前

重庆晨报 · 讣告！一级演员今晨逝世，享年90岁

3 天前

重庆晨报 · 讣告！一级演员今晨逝世，享年90岁

3 天前

丁香学术 · Adv. Sci：南方医科大余潇团队揭示弓形虫病及抗肿瘤新功能机制

6 月前

中石化石油工程建设有限公司 · 兵头将尾丨蔡文乙：市场开拓先锋

3 月前

魔都财观 · 2024年，上海初中梯队排名巨变！

2 月前