大模型应用工程师面经~ AI相关岗位内推

● 自我介绍
● 了解 DeepSeek-R1 吗?介绍一下?
● R1 的 MLA 是如何实现 KV-Cache 的节约
● R1 在 SFT 时冷启动的目的
● 位置编码是什么?解释 ROPE?
● 一个 14B 的模型,推理和训练要多少缓存
● 显存的占用和哪些因素有关
● 大模型灾难性遗忘是什么?如何解决?
● BF16、FP16、FP32 对比?
#AI内推[话题]#● Adam、AdamW 原理
● deepspeed 的三个阶段

● 自我介绍
● 手写 Self-Attention 公式,解释 Q/K/V 的作用
● 位置编码有哪些实现方式?相对位置编码相比绝对位置编码的优势?
● LayerNorm 和 BatchNorm 的区别?为什么 Transformer 用 LayerNorm?
● 多头注意力的本质是什么?头数如何影响模型性能
● 大模型训练中的显存瓶颈如何解决?
● LoRA/Adapter/P-Tunning 的区别?如何选择微调方法?
● 解释 PLHF 流程,客服场景如何应用?
● 大模型灾难性遗忘的原因和缓解方法?
● 如何实现混合精度训练(AMP)?遇到 NaN 怎么处理?
● Deeppspeed 的 ZeRO 阶段 1 2 3 分别优化了什么?
● 解释梯度累计的原理和实现代码?

26届校招华为AI岗位内推:
  "AI算法工程师"
  "大模型应用工程师"
  "AI数据工程工程师"
  "AI安全工程师"
  “AI软件开发工程师”
岗位多多,欢迎私聊,或者**************
#内推##AI面经##AI内推[话题]##牛客AI配图神器#
全部评论

相关推荐

8.28投递 免笔试(暑期实习通过)9.23,武汉场线下,一天三面报软件算法岗是为了复用笔试成绩,接口人说具体哪个岗不重要进来了都一样,ai算法下面的改题型所以不能免笔试。面试强度拉满,面试官没有一个自己部门的,和接口人说的情况完全不一样,我前期尽力问了很多相关信息,问了好多部门好多接口人,最后面试情况还是出乎意料了。面试官全都不懂我这个方向,很看重纯算法理论和代码。算是硬着头皮挺过了拷打,已经114525。一面40min,全程基本都是问八股,语言的底层的都有,笔试复盘(纸上画思路),手撕代码(链表),基本没问项目。基本都硬顶着答上了,我超常发挥,每个问题都尽量发散着跟他讲了很多我会的东西。最后简单交流了一下,才知道他是研发管理大部门下面的,不是我们小部门下面的,方向跟我完全对不上。二面面试官还是不懂我的方向的。全程50min,项目方面就想关注我的论文里算法有关的创新,跟数学、数据结构相关的,我说我做的机器人方向,可能偏底层的算法接触的不多,交涉了好久,我回答什么都不是他想要的。手撕链表+排序,没写出完整代码但是说了多种排序的思路,他说思路都是对的但是完整代码确实没写出来,说我这个岗位还是偏通用的算法,所以很看重写代码能力这些,这情况跟我接口人说的完全不一样。最后给我上压力了,要求我在一张纸上给他讲明白我的工作,并且要侧重他想要的那种偏底层的算法,给了我一点时间现场准备,我硬生生找了些偏基础的算法的点跟他讲了。最后直接当场告诉我通过了,但是要注重代码基本功。后来我同组朋友的一面是同一个面试官,面试官直接问他是不是和我一个方向的,说不懂我们的方向,只需要找一个能讲的点给他讲明白就行了,全程没有八股,这就是运气吗?唉三面35min,相对来说是压力最小的一个了,问题比较通用,面试官没怎么压力我。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务