|
全景解读 LLM Posting-Train(后训练)技术 机器学习算法那些事 · 公众号 · · 3 天前 · 访问文章快照 |
|
deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention) 机器学习算法那些事 · 公众号 · · 6 天前 · 访问文章快照 |
|
通俗易懂!大模型强化学习 RL入门 机器学习算法那些事 · 公众号 · · 6 天前 · 访问文章快照 |
|
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理 机器学习算法那些事 · 公众号 · · 1 周前 · 访问文章快照 |
|
PyCharm接入DeepSeek超详细完整教程,实现AI编程 机器学习算法那些事 · 公众号 · · 1 周前 · 访问文章快照 |
|
用极小模型复现R1思维链的失败感悟 机器学习算法那些事 · 公众号 · · 2 周前 · 访问文章快照 |
|
我没有大模型经验,可以给个机会吗? 机器学习算法那些事 · 公众号 · · 2 周前 · 访问文章快照 |