2025春招实习面经汇总(已接阿里offer)
个人方向:C++ 开发 + AI Infra。方向不一致的可以直接跳到文末看我的流水账。
个人情况更新:九本海硕,相比两年前多了两段还算有背书的实习。这次基本只投了 AI Infra 相关的岗。
面经
美团
大模型推理引擎研发工程师
笔试(3.8):后端通用方向单选多选 + C++ 读程序写结果 + 1 Hard(LCA) + 2 Easy;
一面(mentor 面,3.20)
- 自我介绍,细问两段实习;
- Attention 逻辑,FlashAttention;
- PyTorch 训练模型流程;
- CUDA 架构,GMEM 与 SMEM 的时延量级(1~2c v.s. 400~600c);
- 算子优化,如何检测性能提升(是否算上显卡本身不同精度的算力差异,计算/访存密集型);
- CUDA 学习过程;
- C++ 八股;
- 做题:nth_element;
- 反问:做 LLM 分布式预训练,主要在 Torch 层面;
二面(leader 面,3.25)
- 自我介绍,没问细节,问具体个人定位;
- 觉得自己一面中有哪些不足之处;
- Python 伪代码手撕 MHA,不要求细节;
- GQA、MLA、GRPO;
- 之前精读过哪篇论文,做个详细介绍;
- 个人优势是什么;有什么能定量展现自己对高标准的追求的例子;
- 反问,吹自家基模,给口头 offer;
4.1 正式 Offer。
阿里控股
爱橙科技-Spark引擎-基础平台研发工程师
一面(mentor 面,3.13)
- 问简历,拷打阿里 FFI 部分;
- C++ 八股;
- 反问,聊天(集团大数据引擎),不确定是否会分配到团队;
二面(leader 面,3.21)
- 自我介绍;
- C++、Linux、SQL、LSM Tree 简单八股;
- 高性能服务器调优问题定位流程;
- 职业规划;
- 反问:尝试各种开源手段、向量化、LLVM 来加速 Spark 引擎;
HR 面(3.26):意向书。
蚂蚁
素质测评+笔试(3.9)
AI金融智能-财保事业群-服销智能部-大模型系统工程师
一面(3.14)
- 问简历,拷打 NV 推理优化部分;
- Java(缓存更新机制、MySQL 锁)、操作系统八股(死锁避免、LRU),A/B Test 方法设计,优化分析思路;
- 简单大模型八股:量化、SFT、DPO;
- 反问,聊天(开放式课题研究型项目制实习);
二面(3.17)
- 问简历(没听完),拷打 NV 推理优化部分;
- Transformer 优化宏观介绍;
- DeepSeek 介绍;
- 场景题:自顶向下的 AI 对话平台性能优化宏观思路;
- 反问,团队介绍;
3.25 拒信。
基础平台研发工程师-C/C++
一面(4.9)
- 问简历,为什么没读研究型硕士;
- 细问量化,为什么 DeepSeek 使用 FP8 而 Qwen 使用 BF16;
- TRT-LLM 和 vLLM 区别,TRT-LLM 都用了哪些加速手段;
- 细问 Continuous batching、Prefix Caching 等,问切分、打 Batch 的维度的依据是什么;
- 场景题:如何设计 GPU 内存管理机制;
- 反问:离线侧推理引擎,开发 + 优化,vLLM/SGLang + Torch + 国产卡 CUDA;
二面(4.14)
- 自我介绍,问模型优化相关;
- 根据简历,细问量化和算子优化;
- 常用矩阵乘法加速手段;
- 近期对开源项目的了解;
- 少量 C++ 八股;
- vLLM 和 SGLang 的了解,PagedAttention;
- 反问:使用并改造 vLLM 等,针对热门模型和架构做优化(模型和算子层都有);
阿里国际
大模型平台研发工程师-AI Business
一面(4.11)
- 自我介绍,没怎么问简历;
- 细问 Memory Coalescing 和 Bank Conflict;
- 为什么 CPU 需要三层 Cache 而 GPU 只需要两层;
- GPU 和 CPU 的统一内存寻址;
- 非对称量化在计算时的区别和影响;
- 有哪些使用 Tensor Core 的方式;WMMA 和 MMA 的区别;
- 编译器中的 SSA;距离说明复杂和简单指令集的区别;
- FP32 转 BF16 有什么优势(指数位相等,尾数位可以直接截断);
- Qwen 各代结构变化;
- 目前推理引擎研究的瓶颈;
- 单机多卡分布式 GEMM 有哪些信息要跨 GPU;
- NVLink 通信带宽是多少;
- x86 函数参数传递方式;GPU 没有压栈指令,那参数传递在软件层面是谁负责的;
- CUDA 手撕:M*K 在 K 方向做 Softmax2D,要求避免爆精度;
- 反问:从 Torch 到 CUDA 到 TVM 都做,云端、端侧推理都做;
二面(4.16)
- 面试官晚到半小时,对方自我介绍;
- 自我介绍,细问经历;
- MNN 框架了解;
- 量化;
- GPU 体系结构,Bank Conflict;
- Transformer 架构;
- 如何解决 Memory Bound;
- 少量 C++ 八股(malloc 和 new 区别),体系结构八股(时空局部性);
- 手撕:非递归二叉树中序遍历;
快手
容器云 AI infra 实习生
一面(mentor 面,2.24)
- 双方自我介绍;
- 对着简历提问;
- 推理部署流量调度;
- 流水线并行的梯度计算;
- 分布式训练流程;
- GPU 体系结构,CUDA Core 和 Tensor Core 的选择;
- Prefix KV Cache,KV Cache 压缩;
- Raft 日志一致性;
- 手撕:LIS 二分;
- 反问,当场给口头 offer;
二面(leader 面,2.28,快手 AI Infra 负责人)
- 自我介绍,强调不要讲凑数经历;
- TRT-LLM 工作最终的优化效果,要具体数值;
- 解释量化算法,看重逻辑的清晰度,对使用工具、算法的理解;
- 如何决定后训练投入成本;
- 场景:做流量调度的优化思路;如果有两个指标对冲,该尝试切换场景还是做 trade-off;
- 介绍 Cutlass 优化思路;
- 针对某个特定 GPU Architecture 的算子优化是否值得;为什么 DeepSeek 之前厂商对 MLSys 方向没有太大进展;
- 反问:容器云 AI Infra 针对的场景,具体人才储备;个人的技术储备几乎没用,软实力才是优势;
HR面(3.3):已拒 Offer。
寒武纪
PyTorch框架研发实习生
一面(3.17)
- 自我介绍,问简历(所有实习+项目);
- C++ 八股、操作系统八股、算法数据结构;
- 反问:PyTorch 适配自研硬件;
淘天
基础平台研发工程师-深度学习引擎
一面(3.28)
- 自我介绍,深挖算子加速相关,问了 40 分钟;
- C++ 和 CUDA 相关问题(较深);
- 反问:做端侧大模型算子加速;
4.4 HR 面,4.7 offer。
百度
大模型推理研发实习生
一面(3.27,对面没开摄像头)
- 自我介绍,问简历;
- DeepSeek 了解;
- 写题:Medium;
- 反问:大模型在昆仑芯上运行,框架开发;
二面(3.31)
- 没自我介绍,直接浅问简历;
- 对 Attention 的理解;
- 一些大模型基础问题;
- CUDA 手撕 All-Reduce;
- 矩阵乘法基本思路;
- 对方表达希望实习六个月,表示做不到;
字节
客户端开发实习生-广告业务
一面(3.17)
- 自我介绍;
- C++ 八股,如何避免较长的循环引用;
- 手撕 shared_ptr;
- 网络八股,HTTPS 流程,TCP 握手挥手流程,中间人攻击;
- 平台开发(鸿蒙、iOS 等);
机器学习系统研发实习生-豆包大模型
一面(4.8)
- 自我介绍,浅问经历;
- 手撕:判断二叉树 B 是否是 A 的子结构;
- 强化学习;
- “客户给你一个模型说速度太慢,从哪些方面着手解决?”;
- 反问:火山引擎训练,从 K8S、Torch 到 CUDA 都做,响应用户问题;
其它
腾讯-WXG-微信支付:C++ 纯业务侧开发,不感兴趣,主动取消二面;
字节-客户端开发实习生-广告业务(3.17):C++ 八股,手撕 shared_ptr,网络八股,鸿蒙、iOS 开发;二面(3.18):方向不匹配,主动取消。
待更新:字节 AML(4.7),蚂蚁(4.9)
复盘
- 阿里两年前一拆 16N 之后,每个 BU 都有自己独立的招聘系统,一般可选两个志愿投递,珍惜机会;
- 腾讯只能投一个,但会无限捞;
- 字节可以无限投但不推荐,因为其中一个岗位推进后会锁简历,流程结束后才会重新释放;因此个人推荐的投递思路是(个人经验,合理性存疑),将一项岗位分成三档,第一次只投最高档的所有职位,估测难有希望后再投下一档;
- 百度和拼多多成为我目前评价最低的两家公司,我不会推荐任何人入职(除非钱给的够多);
- 除非研究生有完整的相关项目经历,且对经典相关论文均有理解,否则不推荐全力投递大厂 AI 相关研究型或优化型岗位(AI 应用开发类岗位除外);
- 尽量拓展并合理用好你的校友、同事资源;主动添加 HR 微信;
- 在拿到 offer 之前不要过多提及其他公司,除非对方主动询问;
最后,欢迎各位相关方向的大佬们**********一起交流(长期有效),话题包括但不限于算法题讨论、职场交流、行业理解,或者其他什么乱七八糟的话题。如果你是想走非 Java 方向互联网的学弟学妹,我可以无偿提供 LC 题思路讲解、备战准备建议等任何我力所能及的帮助(只要我有精力)。
秋招再见。