美团-日常实习-大模型算法一面 攒人品
攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2.openclaw,skills,skills+rl,有没有做过skills的业务,OpenClaw用的是sub
3.agent的形式,还有什么更稳定的形式吗?
4.kimi2.5 agent rl
5.agent项目用的什么卡,计算显存
6.ppo,dpo,grpo,gspo,dapo,ngrpo发展流程
7.为什么rl用grpo
1.项目拷打
2.openclaw,skills,skills+rl,有没有做过skills的业务,OpenClaw用的是sub
3.agent的形式,还有什么更稳定的形式吗?
4.kimi2.5 agent rl
5.agent项目用的什么卡,计算显存
6.ppo,dpo,grpo,gspo,dapo,ngrpo发展流程
7.为什么rl用grpo
全部评论
相关推荐
查看19道真题和解析 点赞 评论 收藏
分享