|
2025智谱AI校园招聘正式启动! 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
黄哲威与丁霄汉为初学者撰写AI会议论文写作手册,独具一格! 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
如何用1024张显卡训练一个模型 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
RWKV作者对OpenAI 发布 o1 系列模型的看法,很深刻 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
小模型在大型语言模型时代的角色:一项全面调查 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
中科院提出GPT-4o实时语音交互的开源对手:Llama-Omni 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
研究表明,LLMs的幻觉问题是我们永远无法逃避的... 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
2万字的SFT for Alignment 总结纪要 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
探究大模型微调 Lora 的不同形态(上篇): AdaLora、 AsLora、 PiSSA、 DoRA 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
AnyGPT | 基于离散表示统一多模态理解与生成:把一种新模态当作一门外语 -- NICE27期 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
Sirius:一种高效的上下文稀疏性校正方法,恢复稀疏模型在推理任务上的性能 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
“后期分块”:用长上下文嵌入模型拯救文本检索 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
中科院提出大模型“基准泄露”排行榜,Qwen模型位居榜首 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
DPO,RM,RLHF 傻傻分不清楚 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
LLMs 能够生成创新的研究想法吗?——一项针对 100 多位 NLP 研究者的大规模人类研究 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
揭秘MagicDec:如何推测解码让长文本处理不再纠结于延迟与吞吐? 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
探索自然语言中的计划搜索:提升大型语言模型代码生成性能的新方法 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
关于如何做科研的一些个人经验 -- 清华AP、Mooncake作者 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
重复采样魔法:用更多样本击败单次尝试的最强模型 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |