微调Llama 3.1，用神器Unsloth

newtype AI · 公众号 · · 2024-08-03 11:24

文章预览

视频号：黄益贺 YouTube / Medium: huangyihe 以下为视频内容的文字版 Meta开源Llama 3.1是一件功德无量的事。因为最好的闭源模型代表着天花板，那是人类可以达到的能力上限。而最好的开源代表着全民福利，那是所有人都可以接触到的基准，是科技平权价值观的展现。这一次，开源的Llama 3.1在性能上达到GPT-4o水平。我们可以通过知识蒸馏，用最大最强的405B模型去打造小模型；也可以通过微调，让8B的模型去适应特定的任务和领域。之前国内有些人说，开源模型是智商税，开源模型会越来越落后。这种人，不是蠢就是坏，跳梁小丑罢了。 OK不跑题，咱们今天来聊一下微调。之前一直没碰这个领域是因为，我感觉条件还没到。现在模型够强了，工具也成熟了。我试了一下，比预想中的容易多了——你看，上周我在newtype社群里发了消息，说要用Unsloth微调Llam ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新北方 · 价值“500万”的牛黄失窃，消失的监控画面成破案关键

昨天

新北方 · 逼停列车！这种行为后果很严重！

昨天

新北方 · “整栋楼震了一下” 15岁男孩在家做实验，引发爆炸

昨天

新北方 · 采摘正当时！沈阳春日采摘清单来了！

2 天前

新北方 · 15年前给父亲买的墓如今葬着别人，法院判了

3 天前

郭磊宏观茶座 · 【广发宏观陈嘉荔】国庆假期海外宏观有哪些值得关注的变化

6 月前

起点锂电 · 行业首届圆柱电池技术论坛定档2025.2.28，深圳举办！

2 月前