快手 日常实习 AIGC算法二面 50m
攒人品中,祝大家都能拿到满意的Offer!
1. 说一下Qwen-VL-2.5的训练过程
2. 为什么Qwen训练中要加后训练,作用是什么?
3. 偏好对齐这一步的作用是什么?
4. 介绍一下SD和FLUX的区别
5. 使用DiT相比UNet的优势
6. CFG的原理是啥
7. LoRA微调的原理
8. DDPM和DDIM有什么区别?
9. 介绍一下PPO和DPO的区别
10. 什么是SMPL?有哪些参数?
11. 使用SMPL的人体在穿宽松衣服时会有什么问题?
12. 介绍一下markov
13. 介绍一下单流和双流Transformer block
14. DiT使用的是BN还是LN,为什么?
15. 使用BN在训练和推理时有什么区别?
手撕MHA
1. 说一下Qwen-VL-2.5的训练过程
2. 为什么Qwen训练中要加后训练,作用是什么?
3. 偏好对齐这一步的作用是什么?
4. 介绍一下SD和FLUX的区别
5. 使用DiT相比UNet的优势
6. CFG的原理是啥
7. LoRA微调的原理
8. DDPM和DDIM有什么区别?
9. 介绍一下PPO和DPO的区别
10. 什么是SMPL?有哪些参数?
11. 使用SMPL的人体在穿宽松衣服时会有什么问题?
12. 介绍一下markov
13. 介绍一下单流和双流Transformer block
14. DiT使用的是BN还是LN,为什么?
15. 使用BN在训练和推理时有什么区别?
手撕MHA
全部评论
相关推荐
04-11 17:36
电子科技大学 Java 点赞 评论 收藏
分享
查看9道真题和解析