|
全是细节 | 聊一聊做Pretrain的经验 NLP工作站 · 公众号 · 科技媒体 · 1 月前 · 访问文章快照 |
|
Quest:一种以查询为中心的长文本数据合成方法 NLP工作站 · 公众号 · · 1 月前 · 访问文章快照 |
|
如何提升角色扮演大模型的拟人能力? NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
Qwen2.5系列模型开源,你值得拥有!!! NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
长文 | 探索基于RL的新LLM scaling范式 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
大模型千卡训练-经验指北 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
浅谈OpenAI o1的价值意义及RL 的Scaling Law NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
六个问题带你看懂什么是理工科学霸-OpenAI o1! NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
大型语言模型实战指南 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
DPO,RM,RLHF 傻傻分不清楚 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
如何获取高质量数据进行代码指令调优? NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
浅谈大模型角色扮演:从当红炸子鸡到无人问津 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
将端侧大模型进行到底-MiniCPM3-4B开源 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
Qwen2-VL:Qwen系列已在开源的路上一骑绝尘 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
这段时间搞大模型的血和泪 NLP工作站 · 公众号 · · 2 月前 · 访问文章快照 |
|
综述 | 大模型的可控文本生成 NLP工作站 · 公众号 · 科技自媒体 · 3 月前 · 访问文章快照 |