专栏名称: newtype AI
分享关于AI的Why和How。
今天看啥  ›  专栏  ›  newtype AI

微调Llama 3.1,用神器Unsloth

newtype AI  · 公众号  ·  · 2024-08-03 11:24

文章预览

视频号:黄益贺 YouTube / Medium: huangyihe 以下为视频内容的文字版 Meta开源Llama 3.1是一件功德无量的事。 因为最好的闭源模型代表着天花板,那是人类可以达到的能力上限。而最好的开源代表着全民福利,那是所有人都可以接触到的基准,是科技平权价值观的展现。 这一次,开源的Llama 3.1在性能上达到GPT-4o水平。我们可以通过知识蒸馏,用最大最强的405B模型去打造小模型;也可以通过微调,让8B的模型去适应特定的任务和领域。 之前国内有些人说,开源模型是智商税,开源模型会越来越落后。这种人,不是蠢就是坏,跳梁小丑罢了。 OK不跑题,咱们今天来聊一下微调。之前一直没碰这个领域是因为,我感觉条件还没到。现在模型够强了,工具也成熟了。我试了一下,比预想中的容易多了——你看,上周我在newtype社群里发了消息,说要用Unsloth微调Llam ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览