字节大模型算法面经

1. 自我介绍
2. 项目深挖
3. RAG的问题与改进方案。
4. 在不能修改模型的情况下,如何调整模型回复风格?
5.平时是否使用vibe coding?对此有什么看法?
6. PPO、DPO、GRPO、DAPO等RL算法的原理和区别。
7. .为什么大模型有few-shot能力?讲一下few-shot能力的原理。
8. 手撕代码:torch写SFT的loss计算代码(注意shift right)
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务