文章预览
来源:投稿 作者:LSC 编辑:学姐 wxg部门,根据简历发问,问的比较泛。 unset unset 一面:2小时 unset unset 1.讲述原理和手写python代码: 多头注意力机制 2.c++代码: 考察树的前序遍历、层次序遍历 3.tranaformer注意力的计算为什么要除以sqrt(k)? 4.cv的transformer和nlp的有什么区别? 5.什么是abtest? 6.介绍假设检验。原假设什么情况下成立? 7.小目标检测的方法有哪些? 8.介绍maskrcnn 的 roi 9.大模型的微调方法 10.给大模型输入超长文本怎么办? 11.介绍rag 12.介绍虚函数和纯虚函数 unset unset 二面:1小时 unset unset 1.大模型词表大小是v,初始化训练的大模型loss期望值是多少? 2.介绍 fp16 和 fp32 3.fp16 产生梯度爆炸怎么🧍解决? 4.QLoRA 是什么原理? 5.大模型的perplexity是什么?如何降低这个指标? 6.用代码实现 perplexity 的计算 7.假设检验 8.显著性水平的含义 9.python
………………………………