|
当心环境内容的干扰:大模型GUI智能体的忠实度研究 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
以DeepSeek-VL为例,详解视觉语言模型原理及代码 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
MIT研究:LLM对世界模型的探索 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
Yann LeCun不看好强化学习:「我确实更喜欢 MPC」 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
GLM-4-Flash竟然免费了,还可免费微调... 让其他公司咋玩 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
从token到patch,一种LLM加速训练策略 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
长文本 Embedding 模型中的“迟分”策略 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
图文跨模态检索研究综述 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
审核失败 深度学习自然语言处理 · 公众号 · · 2 月前 · 访问文章快照 |
|
从ACL 2024录用论文看混合专家模型(MoE)最新研究进展 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
如何解读 Yann LeCun推文建议学生不要在大模型方向工作? 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
prompt综述的解释和个人思考 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
李沐重返母校上海交大,从LLM聊到个人生涯 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
英伟达仅用380B tokens训练刷新8B模型新SoTA,剪枝和蒸馏应该这么用 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
GraphRAG综述来了~ 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
HITSZ-HLT人类语言技术团队招收2025级研究生(含直博生) 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
招聘 | 公众号招聘论文解读小伙伴、NICE论文直播平台寻觅小伙伴! 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
一文讲明白大模型显存占用(只考虑单卡) 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
你的模型真的擅长数学吗?MathCheck:大模型数学推理能力的新评估范式 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |
|
MOE系列模型-浅谈 深度学习自然语言处理 · 公众号 · · 3 月前 · 访问文章快照 |