2025春招实习面经汇总(已接阿里offer)

个人方向:C++ 开发 + AI Infra。方向不一致的可以直接跳到文末看我的流水账。

个人情况更新:九本海硕,相比两年前多了两段还算有背书的实习。这次基本只投了 AI Infra 相关的岗。

面经

美团

大模型推理引擎研发工程师

笔试(3.8):后端通用方向单选多选 + C++ 读程序写结果 + 1 Hard(LCA) + 2 Easy;

一面(mentor 面,3.20)

  1. 自我介绍,细问两段实习;
  2. Attention 逻辑,FlashAttention;
  3. PyTorch 训练模型流程;
  4. CUDA 架构,GMEM 与 SMEM 的时延量级(1~2c v.s. 400~600c);
  5. 算子优化,如何检测性能提升(是否算上显卡本身不同精度的算力差异,计算/访存密集型);
  6. CUDA 学习过程;
  7. C++ 八股;
  8. 做题:nth_element;
  9. 反问:做 LLM 分布式预训练,主要在 Torch 层面;

二面(leader 面,3.25)

  1. 自我介绍,没问细节,问具体个人定位;
  2. 觉得自己一面中有哪些不足之处;
  3. Python 伪代码手撕 MHA,不要求细节;
  4. GQA、MLA、GRPO;
  5. 之前精读过哪篇论文,做个详细介绍;
  6. 个人优势是什么;有什么能定量展现自己对高标准的追求的例子;
  7. 反问,吹自家基模,给口头 offer;

4.1 正式 Offer。

阿里控股

爱橙科技-Spark引擎-基础平台研发工程师

一面(mentor 面,3.13)

  1. 问简历,拷打阿里 FFI 部分;
  2. C++ 八股;
  3. 反问,聊天(集团大数据引擎),不确定是否会分配到团队;

二面(leader 面,3.21)

  1. 自我介绍;
  2. C++、Linux、SQL、LSM Tree 简单八股;
  3. 高性能服务器调优问题定位流程;
  4. 职业规划;
  5. 反问:尝试各种开源手段、向量化、LLVM 来加速 Spark 引擎;

HR 面(3.26):意向书。

蚂蚁

素质测评+笔试(3.9)

AI金融智能-财保事业群-服销智能部-大模型系统工程师

一面(3.14)

  1. 问简历,拷打 NV 推理优化部分;
  2. Java(缓存更新机制、MySQL 锁)、操作系统八股(死锁避免、LRU),A/B Test 方法设计,优化分析思路;
  3. 简单大模型八股:量化、SFT、DPO;
  4. 反问,聊天(开放式课题研究型项目制实习);

二面(3.17)

  1. 问简历(没听完),拷打 NV 推理优化部分;
  2. Transformer 优化宏观介绍;
  3. DeepSeek 介绍;
  4. 场景题:自顶向下的 AI 对话平台性能优化宏观思路;
  5. 反问,团队介绍;

3.25 拒信。

基础平台研发工程师-C/C++

一面(4.9)

  1. 问简历,为什么没读研究型硕士;
  2. 细问量化,为什么 DeepSeek 使用 FP8 而 Qwen 使用 BF16;
  3. TRT-LLM 和 vLLM 区别,TRT-LLM 都用了哪些加速手段;
  4. 细问 Continuous batching、Prefix Caching 等,问切分、打 Batch 的维度的依据是什么;
  5. 场景题:如何设计 GPU 内存管理机制;
  6. 反问:离线侧推理引擎,开发 + 优化,vLLM/SGLang + Torch + 国产卡 CUDA;

二面(4.14)

  1. 自我介绍,问模型优化相关;
  2. 根据简历,细问量化和算子优化;
  3. 常用矩阵乘法加速手段;
  4. 近期对开源项目的了解;
  5. 少量 C++ 八股;
  6. vLLM 和 SGLang 的了解,PagedAttention;
  7. 反问:使用并改造 vLLM 等,针对热门模型和架构做优化(模型和算子层都有);

阿里国际

大模型平台研发工程师-AI Business

一面(4.11)

  1. 自我介绍,没怎么问简历;
  2. 细问 Memory Coalescing 和 Bank Conflict;
  3. 为什么 CPU 需要三层 Cache 而 GPU 只需要两层;
  4. GPU 和 CPU 的统一内存寻址;
  5. 非对称量化在计算时的区别和影响;
  6. 有哪些使用 Tensor Core 的方式;WMMA 和 MMA 的区别;
  7. 编译器中的 SSA;距离说明复杂和简单指令集的区别;
  8. FP32 转 BF16 有什么优势(指数位相等,尾数位可以直接截断);
  9. Qwen 各代结构变化;
  10. 目前推理引擎研究的瓶颈;
  11. 单机多卡分布式 GEMM 有哪些信息要跨 GPU;
  12. NVLink 通信带宽是多少;
  13. x86 函数参数传递方式;GPU 没有压栈指令,那参数传递在软件层面是谁负责的;
  14. CUDA 手撕:M*K 在 K 方向做 Softmax2D,要求避免爆精度;
  15. 反问:从 Torch 到 CUDA 到 TVM 都做,云端、端侧推理都做;

二面(4.16)

  1. 面试官晚到半小时,对方自我介绍;
  2. 自我介绍,细问经历;
  3. MNN 框架了解;
  4. 量化;
  5. GPU 体系结构,Bank Conflict;
  6. Transformer 架构;
  7. 如何解决 Memory Bound;
  8. 少量 C++ 八股(malloc 和 new 区别),体系结构八股(时空局部性);
  9. 手撕:非递归二叉树中序遍历;

快手

容器云 AI infra 实习生

一面(mentor 面,2.24)

  1. 双方自我介绍;
  2. 对着简历提问;
  3. 推理部署流量调度;
  4. 流水线并行的梯度计算;
  5. 分布式训练流程;
  6. GPU 体系结构,CUDA Core 和 Tensor Core 的选择;
  7. Prefix KV Cache,KV Cache 压缩;
  8. Raft 日志一致性;
  9. 手撕:LIS 二分;
  10. 反问,当场给口头 offer;

二面(leader 面,2.28,快手 AI Infra 负责人)

  1. 自我介绍,强调不要讲凑数经历;
  2. TRT-LLM 工作最终的优化效果,要具体数值;
  3. 解释量化算法,看重逻辑的清晰度,对使用工具、算法的理解;
  4. 如何决定后训练投入成本;
  5. 场景:做流量调度的优化思路;如果有两个指标对冲,该尝试切换场景还是做 trade-off;
  6. 介绍 Cutlass 优化思路;
  7. 针对某个特定 GPU Architecture 的算子优化是否值得;为什么 DeepSeek 之前厂商对 MLSys 方向没有太大进展;
  8. 反问:容器云 AI Infra 针对的场景,具体人才储备;个人的技术储备几乎没用,软实力才是优势;

HR面(3.3):已拒 Offer。

寒武纪

PyTorch框架研发实习生

一面(3.17)

  1. 自我介绍,问简历(所有实习+项目);
  2. C++ 八股、操作系统八股、算法数据结构;
  3. 反问:PyTorch 适配自研硬件;

淘天

基础平台研发工程师-深度学习引擎

一面(3.28)

  1. 自我介绍,深挖算子加速相关,问了 40 分钟;
  2. C++ 和 CUDA 相关问题(较深);
  3. 反问:做端侧大模型算子加速;

4.4 HR 面,4.7 offer。

百度

大模型推理研发实习生

一面(3.27,对面没开摄像头)

  1. 自我介绍,问简历;
  2. DeepSeek 了解;
  3. 写题:Medium;
  4. 反问:大模型在昆仑芯上运行,框架开发;

二面(3.31)

  1. 没自我介绍,直接浅问简历;
  2. 对 Attention 的理解;
  3. 一些大模型基础问题;
  4. CUDA 手撕 All-Reduce;
  5. 矩阵乘法基本思路;
  6. 对方表达希望实习六个月,表示做不到;

字节

客户端开发实习生-广告业务

一面(3.17)

  1. 自我介绍;
  2. C++ 八股,如何避免较长的循环引用;
  3. 手撕 shared_ptr;
  4. 网络八股,HTTPS 流程,TCP 握手挥手流程,中间人攻击;
  5. 平台开发(鸿蒙、iOS 等);

机器学习系统研发实习生-豆包大模型

一面(4.8)

  1. 自我介绍,浅问经历;
  2. 手撕:判断二叉树 B 是否是 A 的子结构;
  3. 强化学习;
  4. “客户给你一个模型说速度太慢,从哪些方面着手解决?”;
  5. 反问:火山引擎训练,从 K8S、Torch 到 CUDA 都做,响应用户问题;

其它

腾讯-WXG-微信支付:C++ 纯业务侧开发,不感兴趣,主动取消二面;

字节-客户端开发实习生-广告业务(3.17):C++ 八股,手撕 shared_ptr,网络八股,鸿蒙、iOS 开发;二面(3.18):方向不匹配,主动取消。

待更新:字节 AML(4.7),蚂蚁(4.9)

复盘

  1. 阿里两年前一拆 16N 之后,每个 BU 都有自己独立的招聘系统,一般可选两个志愿投递,珍惜机会;
  2. 腾讯只能投一个,但会无限捞;
  3. 字节可以无限投但不推荐,因为其中一个岗位推进后会锁简历,流程结束后才会重新释放;因此个人推荐的投递思路是(个人经验,合理性存疑),将一项岗位分成三档,第一次只投最高档的所有职位,估测难有希望后再投下一档;
  4. 百度和拼多多成为我目前评价最低的两家公司,我不会推荐任何人入职(除非钱给的够多);
  5. 除非研究生有完整的相关项目经历,且对经典相关论文均有理解,否则不推荐全力投递大厂 AI 相关研究型或优化型岗位(AI 应用开发类岗位除外);
  6. 尽量拓展并合理用好你的校友、同事资源;主动添加 HR 微信;
  7. 在拿到 offer 之前不要过多提及其他公司,除非对方主动询问;

最后,欢迎各位相关方向的大佬们**********一起交流(长期有效),话题包括但不限于算法题讨论、职场交流、行业理解,或者其他什么乱七八糟的话题。如果你是想走非 Java 方向互联网的学弟学妹,我可以无偿提供 LC 题思路讲解、备战准备建议等任何我力所能及的帮助(只要我有精力)。

秋招再见。

全部评论
佬好强 AI infra和存储都拿捏了
4 回复 分享
发布于 04-05 21:23 北京
请问蚂蚁的大模型系统工程师属于ai应用开发吗
1 回复 分享
发布于 04-07 23:48 浙江
面经超详细
点赞 回复 分享
发布于 05-29 23:41 北京
佬,阿里国际二面还有手撕吗
点赞 回复 分享
发布于 05-23 12:33 湖北
老哥,可以加个联系方式吗?
点赞 回复 分享
发布于 05-20 15:33 河北
m
点赞 回复 分享
发布于 04-22 23:06 辽宁
为什么百度和拼多多没那么推荐呀
点赞 回复 分享
发布于 04-14 13:37 上海
能介绍ai应用开发岗位吗
点赞 回复 分享
发布于 04-03 19:04 辽宁
阿里控股是ai infra嘛
点赞 回复 分享
发布于 04-02 11:59 上海

相关推荐

评论
20
60
分享

创作者周榜

更多
牛客网
牛客企业服务