今天看啥  ›  专栏  ›  SparksofAGI

演进指令方法增强版:自动演进指令

SparksofAGI  · 公众号  ·  · 2024-07-23 22:10

文章预览

Automatic Instruction Evolving for Large Language Models 演进指令方法增强版:自动演进指令 ‍‍‍‍‍‍‍‍‍ ‍‍‍‍‍ Evol-instruct方法作为一种新增指令微调数据的方法在去年受到了一定关注,熟悉这种方法的朋友应该知道Wizard系列的LM, Coder 和 Math 都利用了类似的方法或衍生方法,简而言之就是将已有的种子数据里的指令复杂化然后让模型生成对应的输出,从而用于增强训练。但是这种问题的缺陷在于, Evol时的指令具体如何编写是需要一些domain knowledge的 ,比如说代码领域可行的“增加时间或空间复杂度”的要求显然不能用在聊天这一domain上,因此自动化Evol这个过程是有必要的,作者希望有一种方法能 1.自动化设计指令演进方法;2.保持指令演进过程中平稳运行,避免出现演进失败的情况 (比如出现演进出没有答案的指令来)。作者提出一种“ Auto E ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览