美团-日常实习-大模型算法一面 攒人品

攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2.openclaw,skills,skills+rl,有没有做过skills的业务,OpenClaw用的是sub
3.agent的形式,还有什么更稳定的形式吗?
4.kimi2.5 agent rl
5.agent项目用的什么卡,计算显存
6.ppo,dpo,grpo,gspo,dapo,ngrpo发展流程
7.为什么rl用grpo
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务