专栏名称: 机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

大象击股 · 有你们真好！！！ · 2 天前

帆书樊登讲书 · 人生下半场，请置顶自己的感受 · 2 天前

北京LOOK · 国博最美特展 · 不看真的会遗憾 | 北京LOOK · 3 天前

李白楼语堂 · 保真吗？长沙奥体中心，曝光“新效果图”？！但 ... · 4 天前

青春川大 · 抢票啦！水木年华进川大，与你相约！ · 5 天前

今天看啥 › 专栏 › 机器学习算法与Python实战

Meta官方：Llama微调指南发布！

机器学习算法与Python实战 · 公众号 · · 2024-08-29 13:53

文章预览

转自：新智元开源，就要开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模型预训练预训练是指，使用数万亿个token数据，从头开始训练LLM的过程，通常使用自监督算法进行训练。最常见的情况是，训练通过自回归预测下一个token（也称为因果语言建模）。预训练通常需要数千个GPU小时（105-107个），并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练（也称为第二阶段预训练）将使用全新的、未见过的领域数据进一步训练基础模型。这里，同样使用与初始预训练相同的自监督算法。通常会涉及所有模型权重，并将一部分原始数据与 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

大象击股 · 有你们真好！！！

2 天前

帆书樊登讲书 · 人生下半场，请置顶自己的感受

2 天前

北京LOOK · 国博最美特展 · 不看真的会遗憾 | 北京LOOK

3 天前

北京LOOK · 国博最美特展 · 不看真的会遗憾 | 北京LOOK

3 天前

李白楼语堂 · 保真吗？长沙奥体中心，曝光“新效果图”？！但位置……

4 天前

李白楼语堂 · 保真吗？长沙奥体中心，曝光“新效果图”？！但位置……

4 天前

青春川大 · 抢票啦！水木年华进川大，与你相约！

5 天前

青春川大 · 抢票啦！水木年华进川大，与你相约！

5 天前

寻乐猪 · 【广州】即将上演｜热血动漫的召唤已经响起，一起来演唱会现场感受心跳的共鸣吧！

4 月前

月読 · 有一种艺术叫弗里达

2 月前