|
R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
老刘的R1类推理大模型三部曲及RAG小课堂正式发布 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
Deepseek R1及Deep research复现回顾及近期前沿进展速递 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
R1-GRPO强化范式用在KG抽取的粗暴实现:兼看RAG、推理加速等相关进展 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
让推理大模型如何思考很重要:回溯DeepSeek-R1中11个数据问题 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
落地角度看think推理类大模型的技术优缺点及潜在风险:老刘说NLP技术社区第37讲精彩回顾 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |
|
KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新 老刘说NLP · 公众号 · · 1 月前 · 访问文章快照 |