|
图解大模型训练系列:序列并行 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
大模型SFT数据选择方法综述 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
复现 OpenAI o1 的一小步:Steiner 开源模型解析 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
Perplexity CEO揭秘:不训大模型、关键在于检索、排序、编排 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
字节大模型搞推荐,有业务收益了 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
OpenAI 12月发布最新模型Orion?Altman又辟谣 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
LLM洗数据:数据或许比算法更重要?大模型剪枝中的校准数据 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
LLM洗数据:怎么做Continue Pretrain的数据 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
LLM洗数据:数据去重之Simhash&Minhash分析与实现 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
小红书用大模型搞推荐 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
Claude 3.5,学会了用电脑!遥遥领先openAI 包包算法笔记 · 公众号 · 科技自媒体 · 6 月前 · 访问文章快照 |
|
如何用一个统一的视角,分析RLHF下的各种算法? 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
Yann LeCun最新演讲:基本上不做LLM了 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
万字长文梳理LLM+RLHF的脉络 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
大模型SFT暗藏陷阱?梯度累计有坑 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
字节实锤大模型造实习生攻击?这下反而更... 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |
|
手撕LLM+RLHF+VLM+o1推理,我全都要!!! 包包算法笔记 · 公众号 · 科技创业 科技自媒体 · 6 月前 · 访问文章快照 |
|
如何从头训练大语言模型: A simple technical report 包包算法笔记 · 公众号 · · 6 月前 · 访问文章快照 |