字节大模型算法岗，被疯狂拷打。。。

机器学习社区 · 公众号 · · 2025-04-09 08:14

文章预览

最近春招和日常实习已开启。不同以往的是，当前职场已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。总结链接如下：《大模型面试宝典》(2025版) 正式发布！喜欢本文记得收藏、关注、点赞。更多实战和面试交流，文末加入我们星球情况介绍：硕士应届，有手撕，不过基本都在hot100范围内，面试还是压力很大的，有时候一时间答不出来就直接pass了，有问题欢迎与我交流。一面深挖多模态论文介绍transformer架构详细说一下Decoder的因果注意力 QKV分别来自哪 Attention为什么要做scaled 不做会怎么样为什么用根号d_k Transformer怎么做加速训练（KV缓存）训练和推理有什么区别（并行化）深挖多模态大模型论文用的video ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博