2025-12-18 10:15 浙江大学算法工程师

关注

淘天大模型算法一面-秋招面经

1. 实习介绍
2. 挑一个你最熟悉的大模型项目，讲讲它的目标，你主要负责什么，以及你觉得最有意思的技术点。
3. 在Transformer的Decoder里，我们为什么需要用Mask把未来的信息“遮住”？从代码实现上讲，这个Mask具体是怎么作用在Self-Attention分数上的？
4. 关于LayerNorm放在残差连接的“前面”还是“后面”（Pre-LN vs Post-LN），社区里有很多讨论。这两种设计选择，主要会影响训练过程的哪些方面？你更倾向于哪一种，为什么？
5. 我们要在线上部署一个大模型提供服务，推理速度和吞吐量是个大问题。像vLLM这样的工具，它主要是通过什么核心思想（比如PagedAttention）来解决KV Cache的内存问题，从而提升推理效率的？
6. 我们有一个基础模型，但它不太会“听人话”。如果想把它训练成一个能很好遵循指令的聊天助手，通常有几步？能简单说说SFT（监督微调）和基于人类反馈的对齐（比如PPO/DPO）分别是在解决什么问题吗？
7. 假设我们有一个效果很好的70B大模型，但因为太大太慢，没法直接上线。现在需要你把它“变小变快”。你会考虑用哪些方法（比如剪枝、量化）？各自有什么优缺点？
8. 相比于让大模型直接回答问题，现在很流行的RAG（检索增强生成）方案，它最大的好处是什么？主要解决了什么痛点？
9. 我们的RAG系统上线后，发现有时候还是会“胡说八道”，或者答非所问。如果让你去排查，你会从哪些方面入手？（比如是检索模块没找对，还是生成模块没理解好？）
10. 核心代码模式算法题：二叉树的中序遍历
11. 反问

全部评论

推荐最新楼层

腾讯阿里都面了呀，你更像去哪一个

点赞回复分享

发布于 2025-12-21 23:23 北京

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

04-06 23:49

已编辑

华中科技大学算法工程师

没有bat实习秋招能去bat吗？

投票

没有bat字节阿里腾讯的实习，只有二线大厂的实习，秋招还可以去这三家吗？听说腾讯阿里基本上hc只给转正了

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

04-06 23:28

华中科技大学算法工程师

有没有bat大厂实习秋招差别大吗？

投票

没有bat这御三家的实习经历，秋招去向薪资差别大吗？只有非bat的两段二线大厂的实习经历，日常焦虑中引流：字节阿里腾讯美团京东快手小米百度

点赞评论收藏

分享

03-31 17:43

重庆大学 Java

java后端改简历

有什么需要改的吗

点赞评论收藏

分享

评论

2

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些AI项目值得做？ #

14315次浏览 400人参与

# 秋招笔试记录 #

397257次浏览 2192人参与

# 华泰星战营，提前锁定校招offer #

11331次浏览 348人参与

# 实习时最怕听到的一句话 #

13230次浏览 132人参与

# 90后北漂现状 #

38563次浏览 221人参与

# 找不到大厂实习可以去小厂吗？ #

11511次浏览 101人参与

# 机械人，说说你的烦心事 #

143793次浏览 1150人参与

# 应届生初入职场，求建议 #

332316次浏览 2913人参与

# 简历上如何体现你的“AI”能力？ #

6365次浏览 161人参与

# 你简历上最心虚的一句话 #

13972次浏览 151人参与

# 没有面试的日子里，你在做什么 #

7833次浏览 216人参与

# 如果有时光机，你最想去到哪个年纪？ #

77003次浏览 857人参与

# 你总挂在第__面？ #

4666次浏览 44人参与

# ai智能作图 #

682136次浏览 5723人参与

# 汉得笔试 #

3854次浏览 23人参与

# 24届秋招同行攻略分享 #

1478117次浏览 14432人参与

# 你知道最慷慨和最抠的公司分别是 #

6812次浏览 58人参与

# 绿盟笔试 #

3361次浏览 24人参与

# 大厂无回复，继续等待还是奔赴小厂 #

356578次浏览 2024人参与

# 拼多多工作体验 #

57553次浏览 406人参与

# 互联网公司爆料 #

186093次浏览 736人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务