文章预览
最近春招和日常实习已开启。 不同以往的是,当前职场已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。 总结链接如下: 《大模型面试宝典》(2025版) 正式发布! 喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球 情况介绍:硕士应届,有手撕,不过基本都在hot100范围内,面试还是压力很大的,有时候一时间答不出来就直接pass了,有问题欢迎与我交流。 一面 深挖多模态论文 介绍transformer架构 详细说一下Decoder的因果注意力 QKV分别来自哪 Attention为什么要做scaled 不做会怎么样 为什么用根号d_k Transformer怎么做加速训练(KV缓存) 训练和推理有什么区别(并行化) 深挖多模态大模型论文用的video
………………………………