|
用LLM做文本分类,微调选base还是chat 包包算法笔记 · 公众号 · · 昨天 · 访问文章快照 |
|
离谱!裁员裁出新高度了。。。 包包算法笔记 · 公众号 · · 5 天前 · 访问文章快照 |
|
DeepSeek-V3技术报告完整解读 包包算法笔记 · 公众号 · · 6 天前 · 访问文章快照 |
|
从infra的视角聊聊DeepSeek-V3 包包算法笔记 · 公众号 · · 1 周前 · 访问文章快照 |
|
Deepseek V3 预训练策略解读 包包算法笔记 · 公众号 · · 1 周前 · 访问文章快照 |
|
智谱zero推理大模型,2024压轴发布! 包包算法笔记 · 公众号 · · 1 周前 · 访问文章快照 |
|
DeepSeek-V3即将开源 包包算法笔记 · 公众号 · · 2 周前 · 访问文章快照 |
|
如何从零到一做大模型pretrain 包包算法笔记 · 公众号 · · 2 周前 · 访问文章快照 |