阿里控股大模型算法一面凉经 面麻了
攒人品中,祝大家都能拿到满意的Offer!
1.实习拷打
2.实习项目:重点问了数据处理的步骤,配比,怎么评判质量
3.实习项目:GUI-Agent的思考,介绍技术,怎么做的异步训练,怎么评判完成等等
4.讲一下PPO和GRPO
5.知道哪些attention变体,讲一下。问知不知道linear attention,qwen3.5和minimax2.5都用了
6.PPO和GRPO的token前后奖励一不一样,这个我实在不明白,说不太懂这个地方
7.vibe coding
1.实习拷打
2.实习项目:重点问了数据处理的步骤,配比,怎么评判质量
3.实习项目:GUI-Agent的思考,介绍技术,怎么做的异步训练,怎么评判完成等等
4.讲一下PPO和GRPO
5.知道哪些attention变体,讲一下。问知不知道linear attention,qwen3.5和minimax2.5都用了
6.PPO和GRPO的token前后奖励一不一样,这个我实在不明白,说不太懂这个地方
7.vibe coding
全部评论
相关推荐
点赞 评论 收藏
分享
04-21 22:01
门头沟学院 Java 鱼专:牛客上的都是幸存者,没offer能天天发吗,这些人没有任何参考价值。少看牛客,你要说在牛客看贴子学东西,也就面经有用,焦虑倒是一堆,广告倒是一堆
点赞 评论 收藏
分享