|
LLama 405B技术报告解读(二) 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
LLama 405B 技术报告解读 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
重磅!Llama3.1的405B权重和评测提前泄漏 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型Infra发展路径盘点 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型对齐,这些方法更替太快了 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
3万字讲解大模型高效推理|清华综述 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型测速,不服跑个分?glm4-airx遥遥领先 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
大模型分离式推理架构从DistServe谈起 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
LLM Continue Pretrain(2024版) 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
手把手实现自己的mini大模型 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
超越DPO之Step-DPO 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
从WAIC谈大模型认知迭代 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
从零训练的 1B 以下小模型汇总 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
后GPT时代,多模态才是最大机会 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
颜水成团队:重磅发布通用视觉多模态大模型Vitron,代码开源! 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
月之暗面kimi底层推理系统方案揭秘(二) 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
一人发顶会,找idea方法论,以LLaMA为例 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |
|
月之暗面kimi底层推理系统方案揭秘 包包算法笔记 · 公众号 · · 4 月前 · 访问文章快照 |