|
o1复现的一点点心得 深度学习自然语言处理 · 公众号 · · 昨天 · 访问文章快照 |
|
审核失败 深度学习自然语言处理 · 公众号 · · 昨天 · 访问文章快照 |
|
百度&人大:长文本LLM全排序能力新方法 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
212页PPT:大模型时代的具身智能 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
大模型推理张量并行的4种模式 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
RWKV-7:极先进的大模型架构,长文本能力极强 深度学习自然语言处理 · 公众号 · · 2 天前 · 访问文章快照 |
|
今天Qwen2.5技术报告发布啦! 深度学习自然语言处理 · 公众号 · · 4 天前 · 访问文章快照 |
|
Anthropic: 预训练阶段引入人类反馈更安全 深度学习自然语言处理 · 公众号 · · 4 天前 · 访问文章快照 |
|
Tokenization不存在了?Meta最新研究,无需Tokenizer的架构来了 深度学习自然语言处理 · 公众号 · · 4 天前 · 访问文章快照 |
|
图解OpenRLHF中基于Ray的分布式训练流程 深度学习自然语言处理 · 公众号 · · 4 天前 · 访问文章快照 |
|
实践指南: hzwer大佬的模型优化与迭代策略 深度学习自然语言处理 · 公众号 · · 5 天前 · 访问文章快照 |
|
如何用一个统一的视角,分析RLHF下的各种算法? 深度学习自然语言处理 · 公众号 · · 5 天前 · 访问文章快照 |
|
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源 深度学习自然语言处理 · 公众号 · · 5 天前 · 访问文章快照 |
|
模仿、探索与自我提升:慢思考推理系统的复现之路 深度学习自然语言处理 · 公众号 · · 6 天前 · 访问文章快照 |
|
只要捞"偏门",篇篇都是顶会顶刊! 深度学习自然语言处理 · 公众号 · · 6 天前 · 访问文章快照 |
|
NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架 深度学习自然语言处理 · 公众号 · · 6 天前 · 访问文章快照 |
|
圆桌会 | 荣幸邀请到Meta、OSU、哈佛&MIT学者来分享Agent前沿~ 深度学习自然语言处理 · 公众号 · · 6 天前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |
|
审核中 深度学习自然语言处理 · 公众号 · · 1 周前 · 访问文章快照 |