百度 - 大模型后训练实习生 二面

📍面试公司:百度

🕐面试时间:2026.03.20

💻面试岗位:文心一言 后训练

❓面试问题:

  1. 自我介绍,教育背景,项目,和实习(两段本科Java web实习,没有后训练实习经验)
  2. GRPO训练的数据流
  3. KL散度的计算公式,怎么做平滑
  4. softmax的计算公式,怎么防止数值爆炸,有什么影响
  5. GRPO里的$\pi_\theta$, $\pi_\theta_{old}$, $\pi_\theta_{rollout}
  6. GRPO里是off-poliy/on-policy,当batch_size非常大时,如何缓解off-poliy的问题?
  7. 平时使用vibing code的频率,以及使用的模型有哪些?
  8. 了解TRL,VERL吗?
  9. transformers,pytorch库使用频率
  10. 编程题:使用transformers,pytorch实现Qwen2模型的SFT训练
  11. 反问:
  12. 实习base - 上海
  13. 实习薪资 - 250+20
  14. 业务方向 - 后训练,开源生态,科研导向

🙌面试感想:

  1. 薪资太低
  2. GRPO训练的工程实践匮乏
#发面经攒人品#
全部评论
这个薪资正常吗...感觉太少了吧
点赞 回复 分享
发布于 03-22 22:39 浙江

相关推荐

头像
04-07 11:41
湖南大学 安卓
三步走策略如下:第一步:明确你的“入行”定位在动手写代码前,先问自己一个问题:我想用 AI 做什么? 这决定了你的起跑线。路径 :AI 应用开发者(最推荐,需求最大)目标: 利用现有的开源模型(如 Llama、Qwen)和框架,搭建能解决实际问题的应用(如企业知识库、自动化办公助手、AI Agent)。建议: 如果你没有明确的科研打算,请直接从“路径 A”开始。2026 年的市场更看重“落地能力”,即你能否用 AI 做出东西来。第二步:死磕 Python 基础(必经之路)无论你选哪条路,Python 都是绕不开的通用语言。但请注意,不要试图学完 Python 的所有知识,你只需要掌握 AI 开发最核心的那 20%:基础语法: 变量、循环(for/while)、条件判断(if/else)、函数定义。数据处理“三剑客”:NumPy: 处理矩阵运算(AI 的底层全是矩阵)。Pandas: 处理表格数据(Excel 能做的它都能做,且更强大)。Matplotlib/Seaborn: 画图表,看懂数据分布。环境工具: 学会使用 Jupyter Notebook 或 Google Colab。这是 AI 领域最主流的编程环境,能让你像写笔记一样写代码,所见即所得。避坑指南: 别去学 Python 的 Web 开发框架(如 Django/Flask),除非你确定要做全栈,否则那是浪费时间。第三步:从“调用”开始,而不是“训练”这是 2026 年入门 AI 最大的观念转变。不要一上来就去学怎么从零训练一个神经网络,那太难且枯燥。正解:下载并安装 Ollama。这是目前最火的工具,能让你在普通笔记本上一键运行 Llama 3、Qwen 等开源大模型。任务: 尝试在本地跑通一个模型,并用 Python 代码向它提问。理解“提示词工程”与“框架”:学习 LangChain 或类似的 Agent 框架。希望大家都会越来越好!
现在入门AI首先要做什么...
点赞 评论 收藏
分享
查看11道真题和解析
点赞 评论 收藏
分享
评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务