|
审核中 深度学习自然语言处理 · 公众号 · · 昨天 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO) 深度学习自然语言处理 · 公众号 · · 3 天前 · 访问文章快照 |
|
港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降! 深度学习自然语言处理 · 公众号 · · 3 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 3 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 3 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 3 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |
|
LightTransfer:将你的LLM轻松转为Hybrid model,增强o1-like长文本生成能力 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |
|
新突破!xJailbreak:用强化学习「越狱」大模型,可解释性黑盒攻击来了 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |
|
腾讯AI Lab联合苏大上交提出:少切思路多挖矿,让o1类LLM做题不再「三心二意」 深度学习自然语言处理 · 公众号 · · 2 周前 · 访问文章快照 |