自我进化！自对齐方法不需要人工注释或者蒸馏，而且效果更好 | NIPS 2024

深度图学习与大模型LLM · 公众号 · · 2024-11-28 22:31

文章预览

新智元报道编辑：alan 【新智元导读】代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！ LLM作为智能的基座，可以衍生出各种能力。代码能力就是其中一种：程序补全、注释、优化、修bug、测试等等。而想要充分发挥LLM的巨大潜力，指令调优（Instruction Tuning）是至关重要的一步。当前，高质量指令数据主要有两个来源：人工注释和蒸馏。前者很贵，后者则受到限制。于是，人们开始另辟蹊径。近日，来自UIUC、伯克利等机构的研究人员提出了SelfCodeAlign。这篇工作首次证明了，可以通过自对齐（Self-Alignment）来获得强大的代码模型，不需要人工注释或者蒸馏，而且效果更好！论文地址：https://arxiv.org/pdf/2410.24198 SelfCodeAlign在整个数据生成过程中，使用相同的基础模型进行推理，分为三步：首先，从高 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

最英国 · 唐顿移民问答| 英国公司只有一人也能发工签吗？雇主工签牌照具体如何维护？

昨天

英国大家谈 · 英国移民局突袭中餐厅，居然查到了...

昨天

计算机视觉工坊 · 求秋招找工作搭子！

5 月前

程序员小灰 · 卖了一千多万份，黑神话老板和员工能财富自由吗

4 月前

百度AI · 基于PP-ShiTuv2新增PaddleX图像识别模型产线，显著提升商品识别等细粒度开放域产业场景检索性能

2 月前

大皖新闻 · 年仅29岁！网红“咖啡”患直肠癌去世，此前自曝确诊6个月后决定放弃化疗

3 周前