字节大模型算法面经
1. 自我介绍
2. 项目深挖
3. RAG的问题与改进方案。
4. 在不能修改模型的情况下,如何调整模型回复风格?
5.平时是否使用vibe coding?对此有什么看法?
6. PPO、DPO、GRPO、DAPO等RL算法的原理和区别。
7. .为什么大模型有few-shot能力?讲一下few-shot能力的原理。
8. 手撕代码:torch写SFT的loss计算代码(注意shift right)
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2. 项目深挖
3. RAG的问题与改进方案。
4. 在不能修改模型的情况下,如何调整模型回复风格?
5.平时是否使用vibe coding?对此有什么看法?
6. PPO、DPO、GRPO、DAPO等RL算法的原理和区别。
7. .为什么大模型有few-shot能力?讲一下few-shot能力的原理。
8. 手撕代码:torch写SFT的loss计算代码(注意shift right)
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
投票
点赞 评论 收藏
分享