算法打工人小旺

08-10 09:27 中山大学算法工程师发布于山东

关注

百度提前批一面：说下grpo训练loss怎么算

1.自我介绍1min
2.项目介绍，提到了grpo训练
3.说一下grpo的原理以及loss计算
（从策略梯度公式推导开始讲，以及grpo的组间reward怎么算的）
4.为什么需要加上kl约束
（防止更新不稳定，探索太远了）
5.grpo的kl是怎么计算的
（记得是k3-kl）
6.那如果你训练中大量出现全对全错的样本怎么办
（直接丢弃？）
7.如果全部丢弃，会带来什么问题？
（我说有论文表示丢弃没啥问题hhh）
8.面试官摇头，我说那要不再多rollout几个样本
9.怎么多rollout几个？你算一下如果是8张A100训练7B的模型，grpo可以rollout几个样本不炸显存？
10.coding torch写一下grpo的loss吧
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

09-19 17:26

香港大学推荐算法

华为笔试华为AI算法 0903

笔试时间：2025年9月3日往年笔试合集：2023春招秋招笔试合集2024春招秋招笔试合集第一题在 MOE 模型训练时，token 会依据概率发送到 topk 个不同专家计算，这些专家分布在多个 NPU 卡上。Device - Limited routing 算法可将 token 路由目标限制在 p个 NPU 以降低通信成本，具体步骤如下：把 n个专家平均分配在 m个 NPU 上，每个 NPU 上的专家为一个组；设 n个专家的编号为 N = [0,1,2,…,n−1]，同一个专家组上的专家编号是连续的；每个专家对应一个概率，表示被路由到的可能性；用每个组中的最大概率作为本组代表，从所有组中选择...

投递华为技术有限公司等公司10个岗位

点赞评论收藏

分享

08-23 09:50

已编辑

门头沟学院算法工程师

📍面试公司：小鹏汽车💻面试岗位：大模型❓面试问题：1. 拷打实习。实习和项目挑一个成长最大的，还要问为什么成长最大2. 讲了一下dpo的原理3. grpo，dpo，ppo这些的区别4. lora的原理，对lora的后续改进，除了qlora还有什么其他维度5. 为什么会选择小鹏手撕快排反问环节

内推__免笔试：同学，瞅瞅我司，医疗独角兽，校招刚开，名额有限，先到先得，我的主页最新动态，绿灯直达，免笔试～

查看6道真题和解析

点赞评论收藏

分享

09-18 15:16

门头沟学院算法工程师

只投了十几家就不想投了

不想一个个官网填信息不想一个个看jd不想工作不想写笔试不想面试关键是努力了又收不到offer真的很烦，我不知道该怎么办就是不想投😓😓😓😓

秋招报数：你投了多少家公...

点赞评论收藏

分享

09-15 23:18

已编辑

门头沟学院 Java

美团小象超市暑期转正

想知道还有多少人暑期无消息的就算没过为什么不早点给个痛快-9.15收到意向了

投递美团等公司10个岗位

点赞评论收藏

分享

09-02 17:36

门头沟学院后端工程师

美团留用急急急急急

上周同部门同 x1 已经有实习生收到转正 offer 了，我现在还没收到，问 mentor 也是没消息，是不是已经寄了

投递美团等公司10个岗位

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI创作大赛：牛可乐的国庆之旅 #

14383次浏览 208人参与

# 工作两年想退休了 #

158806次浏览 1313人参与

# 携程求职进展汇总 #

637110次浏览 4656人参与

# 面试中，你被问过哪些奇葩问题？ #

75767次浏览 821人参与

# 硬件人求职现状 #

462377次浏览 4726人参与

# 国庆假期，给大脑放个假 #

2347次浏览 31人参与

# 深信服秋招来了 #

271048次浏览 2905人参与

# 我的租房踩坑经历 #

171449次浏览 1128人参与

# 通信硬件人社招/春招/实习投递现状 #

29592次浏览 947人参与

# 大学四年该怎么过，才不算浪费时间？ #

12411次浏览 73人参与

# 网申一定要掌握的小技巧 #

13235次浏览 74人参与

# 你小时候最想从事什么职业 #

121801次浏览 1900人参与

# 牛友的国庆旅行碎片 #

7452次浏览 65人参与

# 国庆放假，你还会投简历吗？ #

10861次浏览 117人参与

# 查收我的offer竞争力报告 #

216049次浏览 1402人参与

# 材料专业可以靠半导体脱坑吗？ #

23353次浏览 131人参与

# 预测一下26届秋招形势 #

99945次浏览 483人参与

# 国庆放假，你还会主动学习吗？ #

14179次浏览 74人参与

# 五一假期，你打算“躺”还是“卷”？ #

80590次浏览 715人参与

# 距离放假还有_天，我已经…… #

15771次浏览 194人参与

# 如何排解工作中的焦虑 #

215698次浏览 2084人参与

# 机械/汽车制造公司爆料 #

47912次浏览 217人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务