|
面向本硕博学生的志愿者招募!丰富的助学稿酬!提升科研能力,走向学术前沿! 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
知识编辑——大语言模型原理探索 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
一份MoE 可视化指南 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
还在“卷”长度?长文本模型真的基于上下文进行回复吗? 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
强化学习10:ChatGPT 也用上PPO?具体算法,眼前一亮 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
使用小尺寸大模型和 Dify 清洗数据:Qwen 2.5 7B 深度学习自然语言处理 · 公众号 · 科技媒体 · 1 月前 · 访问文章快照 |
|
什么!SFT完全没用! 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
大模型是否具有自己风格?这个风格来自于哪里? 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
分享一些高效阅读论文和代码的方法 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
万字干货!从零到一进行LLM pretrain的经验 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
一文讲明白大模型分布式逻辑(从GPU通信原语到Megatron、Deepspeed) 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
MOE模型的过去、现状和未来是怎样的? 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
Qwen2-VL series 技术报告解读 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
现代LLM基本技术整理 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
万字长文总结多模态大模型最新进展(生成-理解大一统) 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
速读 LLaMA3.2-Vision 模型的结构 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
Reader-LM:将原始HTML转换为干净Markdown的小型语言模型 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
全量指令微调有害! 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
张俊林:OpenAI o1原理逆向工程图解 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |
|
百舸AI异构计算平台4.0:在大模型时代发挥出AI大集群的有效算力 深度学习自然语言处理 · 公众号 · · 1 月前 · 访问文章快照 |