26校招腾讯LLM算法一面 1h
继续来分享下之前的面经~欢迎友好讨论,信息共享
八股
1. 为什么用decode-only,相比于encoder-only和encoder-decoder的区别;
2. 对attention的了解、MHA、GQA这些;
3. 分布式训练方式deepspeed这些;
4. ppo的了解,grpo,dapo的了解,grpo可能存在哪些劣势
5. ppo相比于之前的RL方法的创新点
coding
将一个整数拆成k个和的形式,求最大乘积
八股
1. 为什么用decode-only,相比于encoder-only和encoder-decoder的区别;
2. 对attention的了解、MHA、GQA这些;
3. 分布式训练方式deepspeed这些;
4. ppo的了解,grpo,dapo的了解,grpo可能存在哪些劣势
5. ppo相比于之前的RL方法的创新点
coding
将一个整数拆成k个和的形式,求最大乘积
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享