01-29 01:50 陕西理工大学算法工程师

关注

腾讯LLM大模型算法二面-实习面经

1.八股：GRPO 和 PPO 在 RLHF 中的核心区别是什么？为什么选择 GRPO 而不是 PPO？
2.八股：KL 散度在 RLHF 中的作用是什么？它的公式如何直观理解？
3.八股：vLLM 的核心优势是什么？它是如何通过 PagedAttention 提升显存利用率的？
4.八股：Qwen3 和 DeepSeek-R1 在架构上有哪些关键差异？（如 MLA、MoE、GQA 等）
5.项目：微调数据集的结构是怎样的？有多少条？数据清洗和有效性验证是怎么做的？
6.项目：奖励函数是如何设计的？是否考虑了回答的正确性（如推荐商品是否真符合用户需求）而不仅是长度或流畅度？
7.项目：怎么避免模型靠堆字数刷奖励？
8.项目: KV Cache 在长上下文推理中可能被污染，你们有做缓存隔离或清理机制吗？
9.项目：本地部署时，如何平衡 vLLM 的上下文长度和显存占用？是否做过量化或动态批处理？
10.手撕：乘积最大子数组（LeetCode 152）

全部评论

推荐最新楼层

武汉大学 C++

佬的项目是啥

点赞回复分享

发布于 03-10 10:50 北京

03-12 22:02

哈尔滨工业大学深度学习

3/12携程机考选择题/编程题

在实现一个大规模DBSCAN算法的分布式版本时，为了优化查找每个点的eps-邻域内的邻居这一核心步骤，数据工程师通常会采用哪种技术手段来避免全量数据点的两两比较，从而显著降低计算复杂度？ A. 对特征进行PCA降维 B. 使用空间索引结构 C. 增加min_samples参数的值 D. 对数据点进行随机抽样   在机器翻译任务中，RNN通常采用哪种输入输出模式？ A. 多对多 (Many-to-Many) B. 一对多 (One-to-Many) C. 多对一 (Many-to-One) D. 一对一 (One-to-One)   在风控模型任务中，需要模型输出可解释的结果（如“用户违约原因为...

点赞评论收藏

分享

03-30 16:32

吉林大学 Java

字节后端（大模型安全）实习二面面经（挺难绷的）

1. 自我介绍2. 项目介绍3. 用了什么锁来实现多进程的同步（项目相关，但是我也不知道他具体要问什么锁，所以继续询问具体问题）4. 讲了一遍Redis分布式锁的应用，但是他好像没听懂😅5. 再更加详细讲了一遍分布式锁的工作流程，似乎是不耐烦了直接写算法题6. 算法题是改版的压缩字符串，非力扣题目，需要将一个带有括号和数字的字符串展开，然后再压缩成没有括号的压缩字符串。数字表示重复次数。最后虽然思路对了但因为索引越界bug没A😓接下来还问了些八股：1. stringbuilder和stringbuffer的区别2. stringbuffer具体怎么实现的3. 他们两个哪个代价大4. 知道hashcode吗？Java里面hashcode具体怎么实现的？5. MySQL查询比较慢的原因可能有哪些？怎么优化？（能回答多少就说多少）接着就是问了些个人情况和反问环节总的来说，感觉很差。面试官自己晚到20分钟就算了，面试过程中还跟急着下班一样，想挂就挂呗还特地来刷一波KPI😓……最后过了好几天才发感谢信😅

查看10道真题和解析

点赞评论收藏

分享

03-27 11:40

门头沟学院算法工程师

蚂蚁实习大模型算法一面 1h

发点面经攒攒人品～1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集大模型相关八股提问4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少coding最小生成树

查看15道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

03-30 10:20

门头沟学院算法工程师

阿里大模型应用算法强化学习方向面经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.项目拷打2.实习拷打3. 多轮对话超长上下文如何训练4. 上下文记忆策略5. Skills读取超长sop的优化有哪些trick

查看5道真题和解析

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

62852次浏览 536人参与

# 第一份工作应该选择高薪还是大平台 #

220351次浏览 1035人参与

# 华泰星战营，提前锁定校招offer #

1354次浏览 179人参与

# 考公VS就业，你怎么选？ #

99788次浏览 521人参与

# 卷__卷不过你们，只能卷__了 #

59745次浏览 755人参与

# 小红书求职进展汇总 #

238357次浏览 1397人参与

# 校招第一份工作你干了多久？ #

150000次浏览 630人参与

# 商战，最累的是我们 #

31569次浏览 98人参与

# 大疆求职进展汇总 #

699654次浏览 4351人参与

# AI时代还有必要刷leetcode吗？ #

47764次浏览 563人参与

# 字节7000实习来了，你投了吗？ #

43251次浏览 331人参与

# 想从事Agent应该学习哪些技术？ #

13906次浏览 386人参与

# 大学生该如何认清当下的就业环境？ #

165886次浏览 908人参与

# 海康威视求职进展 #

134552次浏览 555人参与

# 26届春招投递记录 #

4831次浏览 49人参与

# 工作中，努力重要还是选择重要？ #

285842次浏览 2586人参与

# HR面都在聊什么？ #

21433次浏览 236人参与

# 有哪些公司在面试时考察AICoding？ #

27034次浏览 435人参与

# 正在春招的你，也参与了去年秋招吗？ #

394589次浏览 2712人参与

# 校招生月薪1W算什么水平 #

144013次浏览 496人参与

# 从投递到OC，你用了多久 #

36777次浏览 376人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务