昨天 15:01 已编辑同济大学算法工程师发布于上海

关注

百度大模型后训练一面

📍面试公司：百度文心一言

🕐面试时间：2026.03.18

💻面试岗位：大模型RL后训练

❓面试问题：

自我介绍，教育背景，项目经历
项目介绍，基于大语言模型的信号灯控制，问题是什么，如何结合熵，怎么评测，指标结果如何
强化学习理论内容，trust-range和PPO的关系
PPO是off-policy or on-policy? on-policy
为什么会有importance sampling，采样的策略模型和要训练的策略模型有偏差，重要性采样加以修正
PPO的clip在优势A 正/负时限制上/下届，A为正限制上届，A为负限制下届
PPO的损失函数怎么计算的？广义优势估计是怎么计算？GAE中lambda的作用，该值大小和GAE 方差/偏差的关系
GRPO的损失计算，在序列级别的损失上，损失如何给到每一个token上？序列级别平均或批次级别平均
其它GRPO变体？DAPO，GSPO，GFPO等
分布式训练中，优化器/梯度/模型参数占用的显存比例，FSDP和DeepSpeed的Zero-1/2/3
Agentic RL
代码手撕：二叉树的层次遍历，如何记录每个节点在第几层？

🙌面试感想：

leetcode刷少了，非递归方式没有整出来，节点第几层的问题没有做出来

#发面经攒人品#

全部评论

推荐最新楼层

婉拒字节十八次

无锡旅游商贸高等职业技术学校测试工程师

兄弟是官网投的吗我投了一周了没一点动静

点赞回复分享

发布于昨天 10:12 湖北

03-17 23:54

黑龙江大学 Java

这个简历能进大厂吗？

求内推

来个白菜也好啊qaq：可以的，大厂有的缺打手

点赞评论收藏

03-16 19:00

同济大学算法工程师

蔚来大模型强化学习训练一面

📍面试公司：蔚来🕐面试时间：2026.03.16💻面试岗位：大语言模型强化学习算法实习生❓面试问题：自我介绍项目经历1，拷打项目动机，方法细节，评测方式，遇到的难点和解决方式，提出的方法为什么有效强化学习算法理论基础，介绍PPO算法，算法计算公式，优点，训练流程，介绍GRPO算法，特点，优势有关强化学习算法的代码库，TRL，VERL，Ray等询问对于Agentic RL 的认识，其中可能存在的难点，答了算法侧的稀疏奖励问题和工程实现上各类工具的稳定性编程题，word1->word2的最小操作次数🙌面试感想：自我介绍吟唱时间太长，适当压缩为教育背景，研究背景，项目/实习经历的简单介...

查看7道真题和解析

点赞评论收藏

昨天 13:50

门头沟学院推荐算法

字节llm大模型实习一面

继续来分享下之前的面经~欢迎友好讨论，信息共享1.项目相关2.讲讲设计的初衷，模型结构3.为什么会想在重排做生成式4.如果是做生成式召回对模型结构怎么修改5.召回怎么构造负样本6.需要热度纠偏吗，减的那个概率和什么有关7.稀疏 MOE 怎么做的8.beamsearch 怎么做的9.大模型了解多少，强化学习了解什么10.DPO 的全称是什么，公式是什么11.手撕:计算逆序对数量

查看10道真题和解析

点赞评论收藏

03-17 23:06

门头沟学院 Java

Redis使用set设计一个抽奖系统

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花一、设计思路Redis 的 Set（集合）具有元素唯一、支持随机获取的特性，完美契合抽奖系统的核心需求：去重参与：Set 自动去重，避免用户重复抽奖；随机抽奖：通过 SPOP/SRANDMEMBER 命令随机抽取中奖者；高效统计：SCARD 命令快速获取参与人数；结果存储：不同奖项的中奖名单可存入不同 Set，便于管理。核心命令说明：SADD key uId添加用户到抽奖集合（重复添加返回 0）用户参与抽奖SCARD key获取集合元素数量统计参与人数SPOP key N随机...

Redis常用的数据结构

点赞评论收藏

03-14 12:32

合肥工业大学 Java

java已经卷成这样了吗。。。

投票

听的一个认识的小主播说的，在中大厂工作，身边hr抱怨投的简历里几乎所有都是java，离谱到100份只有3-4是其他的，而且最逆天的是不管招什么岗都差不多。招测开，移动端很有难度，因为java实在太多了。。。然后部门leader还补刀了一句，你们移动端简历的都是后端不要的。感觉分出一点时间多看看一些小主播的真实工作分享，或者向校友多问问真的挺有必要，不能当鸵鸟，我以前完全不知道已经离谱成这样了。现在我感觉真的要认真考虑转移动端了。。。好歹有java知识，也不算从零起步吧。我是28届，还有大半年能完全投入。。。

无语的斑马破防了：有点像串的，或者说还是在校生。有机会还是去实习亲自感受一下，选方向要考虑行业发展前景和自身职业规划，后端卷归卷，含金量是最高的

点赞评论收藏

招聘动态

搜狐畅游

26届春招火热进行中

莉莉丝

2026春季校园招聘

招商银行·招银网络科技

2026届校园招聘

麦吉太文

2026校园招聘

神州信息

2026届校园招聘

广发证券Fintech

2026校园招聘

小米集团

2026届春季校园招聘

翼支付

2026届春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录&27届暑期实习

全站热榜

创作者周榜

正在热议

# 面试官最爱问的 AI 问题是...... #

13775次浏览 480人参与

# 银行笔面经互助 #

184676次浏览 1303人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

百度 大模型后训练 一面

全站热榜

创作者周榜

百度大模型后训练一面