专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

UIUC提出Self Code Align方法，实现代码生成模型的自对齐与指令调优

PaperWeekly · 公众号 · 科研 · 2024-11-04 21:07

文章预览

1. 引言在近年来的研究中，大型语言模型（LLMs）在各种编程任务中展现出了卓越的性能。这些任务包括程序合成、程序修复、代码优化、代码补全、代码翻译、软件测试等。现代LLMs通过在海量代码数据上进行预训练，使得它们在理解和生成代码片段方面具备了良好的基础能力。然而，为了充分发挥LLMs的潜力，通常需要在高质量的指令跟随数据上进行进一步的微调，这一过程被称为指令调优。指令调优的关键在于高质量数据的获取。传统上，获取指令数据的方式是依赖人工注释，这种方法成本高昂。例如，Llama-3使用了1000万个人工注释的示例进行指令调优。由于人工注释的高成本，知识蒸馏被广泛采用，以训练较弱的LLM使用强大的LLM生成的输出。然而，蒸馏可能会违反某些专有LLM的服务条款，并且使用强大LLM的前提限制了其通用性。因此，最近的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

实验万事屋 · 师弟问我，读博士研究生这条路顺不顺！我说：当然顺啦！这一路上就没什么人管我的课题……

昨天

募格学术 · AI搞科研2.0时代，不看着实有点亏

2 天前

人机与认知实验室 · 谋算中的因果与归纳不同于计算中的因果与归纳

4 月前

云南新闻网 · 航拍普达措景区：秋日风光迷人

3 月前

中国交建 · 百马高速的边坡“画匠”

3 月前

游戏篝火营地 · 《双人成行》是怎么卖出 2000 万套的？

1 月前