03-20 20:31 同济大学算法工程师发布于上海

关注

百度 - 大模型后训练实习生二面

📍面试公司：百度

🕐面试时间：2026.03.20

💻面试岗位：文心一言后训练

❓面试问题：

自我介绍，教育背景，项目，和实习（两段本科Java web实习，没有后训练实习经验）
GRPO训练的数据流
KL散度的计算公式，怎么做平滑
softmax的计算公式，怎么防止数值爆炸，有什么影响
GRPO里的$\pi_\theta$, $\pi_\theta_{old}$, $\pi_\theta_{rollout}
GRPO里是off-poliy/on-policy，当batch_size非常大时，如何缓解off-poliy的问题？
平时使用vibing code的频率，以及使用的模型有哪些？
了解TRL，VERL吗？
transformers，pytorch库使用频率
编程题：使用transformers，pytorch实现Qwen2模型的SFT训练
反问：
实习base - 上海
实习薪资 - 250+20
业务方向 - 后训练，开源生态，科研导向

🙌面试感想：

薪资太低
GRPO训练的工程实践匮乏

#发面经攒人品#

全部评论

推荐最新楼层

胖墩墩的废话选手想当offer收割机

National University of Singapore 算法工程师

这个薪资正常吗...感觉太少了吧

点赞回复分享

发布于 03-22 22:39 浙江

03-16 19:00

同济大学算法工程师

蔚来大模型强化学习训练一面

📍面试公司：蔚来🕐面试时间：2026.03.16💻面试岗位：大语言模型强化学习算法实习生❓面试问题：自我介绍项目经历1，拷打项目动机，方法细节，评测方式，遇到的难点和解决方式，提出的方法为什么有效强化学习算法理论基础，介绍PPO算法，算法计算公式，优点，训练流程，介绍GRPO算法，特点，优势有关强化学习算法的代码库，TRL，VERL，Ray等询问对于Agentic RL 的认识，其中可能存在的难点，答了算法侧的稀疏奖励问题和工程实现上各类工具的稳定性编程题，word1->word2的最小操作次数🙌面试感想：自我介绍吟唱时间太长，适当压缩为教育背景，研究背景，项目/实习经历的简单介...

查看7道真题和解析

点赞评论收藏

03-30 12:34

门头沟学院算法工程师

阶跃星辰agent算法面经分享攒人品中

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.针对具体业务场景，怎么训练agent调用工具，奖励函数怎么设计和优化的3.怎么优化RL训练agent调用工具的数据，数据配比策略是怎样的4.训练agent调用工具，以react框架为例，plan是什么，提示怎么设计，Obersevation是什么？Action是什么？每一块的输入输出都是什么？长什么样的？5.介绍一下trl/verl架构，有哪些类，主要参数，针对具体任务出现的一些具体情况怎么调参6.用verl训agent调用搜索工具为例，讲一下每一类大致怎么设计，什么作用7.用过其他什么框架，讲了llama factory，swift.问了数据构造、格式

查看7道真题和解析

点赞评论收藏

04-07 11:41

湖南大学安卓

入门AI三步走

三步走策略如下：第一步：明确你的“入行”定位在动手写代码前，先问自己一个问题：我想用 AI 做什么？ 这决定了你的起跑线。路径 ：AI 应用开发者（最推荐，需求最大）目标： 利用现有的开源模型（如 Llama、Qwen）和框架，搭建能解决实际问题的应用（如企业知识库、自动化办公助手、AI Agent）。建议： 如果你没有明确的科研打算，请直接从“路径 A”开始。2026 年的市场更看重“落地能力”，即你能否用 AI 做出东西来。第二步：死磕 Python 基础（必经之路）无论你选哪条路，Python 都是绕不开的通用语言。但请注意，不要试图学完 Python 的所有知识，你只需要掌握 AI 开发最核心的那 20%：基础语法： 变量、循环（for/while）、条件判断（if/else）、函数定义。数据处理“三剑客”：NumPy： 处理矩阵运算（AI 的底层全是矩阵）。Pandas： 处理表格数据（Excel 能做的它都能做，且更强大）。Matplotlib/Seaborn： 画图表，看懂数据分布。环境工具： 学会使用 Jupyter Notebook 或 Google Colab。这是 AI 领域最主流的编程环境，能让你像写笔记一样写代码，所见即所得。避坑指南： 别去学 Python 的 Web 开发框架（如 Django/Flask），除非你确定要做全栈，否则那是浪费时间。第三步：从“调用”开始，而不是“训练”这是 2026 年入门 AI 最大的观念转变。不要一上来就去学怎么从零训练一个神经网络，那太难且枯燥。正解：下载并安装 Ollama。这是目前最火的工具，能让你在普通笔记本上一键运行 Llama 3、Qwen 等开源大模型。任务： 尝试在本地跑通一个模型，并用 Python 代码向它提问。理解“提示词工程”与“框架”：学习 LangChain 或类似的 Agent 框架。希望大家都会越来越好！

现在入门AI首先要做什么...

点赞评论收藏

03-17 14:29

门头沟学院推荐算法

面试总结

这两周面了美团、B 站、百度、小红书等几家大厂，整体感觉和去年暑假的面试节奏完全不一样了👇提问重心变化：纯八股的占比明显变少，更多是围绕实习经历和项目技术栈展开，聊着聊着就穿插问相关知识点。比如聊到登录模块，就会顺带着问双令牌设计、JWT 的实现；聊到文件上传，就会问到分片上传、断点续传的细节。AI 结合成标配：几乎所有面试官都会往 AI 方向提问，问题也更开放。我觉得面试官最爱问的 AI 问题是“如何在业务中用 AI 提效开发”和“设计一个结合 AI 的业务功能”，比如让我设计 AI 辅助订阅会议室、AI 辅助生成患者诊疗方案这类场景题，很考验对 AI 落地的思考。算法 & 场景题：手写代码不再局限于纯算法题，更多是场景化模块设计，比如手写防抖节流、实现 MHA、手撕页面布局；小红书还考了智力题和口撕页面设计，只有腾讯一上来就是两道 LeetCode 热门 100 题，风格差异还挺大的。整体下来，有实习经历背书后，面试更偏向 “做过什么、怎么想的、能不能用 AI 解决问题”，纯靠背八股的时代感觉真的过去了。

查看11道真题和解析

点赞评论收藏

03-23 16:11

复旦大学后端工程师

27暑期offer选择

投票

bg双9 无论文无实习 岗位都是agent开发目前拿到了字节和腾子的offer求牛友们帮忙选选岗位与部门

点赞评论收藏

招聘动态

AI网申助手

网申字段一键填写

龙湖集团数字科技平台

2026届春季招聘&实习生招聘

米哈游2026校园招聘

应届生春招&全年实习生专项

招商银行信用卡中心

2027届暑期训练营

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

创作者周榜

正在热议

# AI时代还有必要刷leetcode吗？ #

34609次浏览 433人参与

# 大学生该如何认清当下的就业环境？ #

162403次浏览 888人参与

# 有哪些公司在面试时考察AICoding？ #

# 想从事Agent应该学习哪些技术？ #

百度 - 大模型后训练实习生 二面

全站热榜

创作者周榜

百度 - 大模型后训练实习生二面