|
可怕!llm训练的bug,梯度累计设置过大,会导致最终loss过大。 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
关于LLM+RL(HF)的片面脉络梳理 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
LLM实践--支线:拯救Continue Pretrain的数据 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
合成数据用于AI训练的艺术与科学 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
双工大模型—真正的对话大模型 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
可视化剖析与代码实践,带你一文掌握Mamba和SSM 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
EMNLP2024分享会要开始啦!6大主题、2多主题,快来预约不错过 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
如何从头训练大语言模型: A simple technical report 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
写在Ph.D第0年:AI/CV科研菜鸟的持续进阶之路 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
长序列(Long Context)大模型笔记 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
Journey Training:o1的一次复现尝试,极长思维链的合成 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
避开复数推导,我们还可以怎么理解RoPE(重制版) 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
决策智能与强化学习:重放比率(replay ratio) 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
招聘 | IT:U奥地利跨学科创新技术大学 Prof. Yufang Hou 招聘NLP方向岗位制博士生、博士后 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
招聘 | 智谱大模型评测优化团队 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
在上下文学习中,语言模型究竟学到了什么? - NICE30期 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
LLAMA-BERRY:o1的一次复现尝试,对比奖励引导self-refine的飞越 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
LLM预训练与SFT数据配比调研 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
知识编辑——祛除模型毒性的新方法 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
田渊栋:求道之人,不问寒暑(十) 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |