快手二面

📍面试公司:快手
💻面试岗位:大模型
❓面试问题:
1. ppo,dpo,grpo是什么各种的优劣
2. ppo中gae的计算
3. dpo的数据要怎么做
4. 对于grpo有什么改进的思路,dapo和gspo分别怎么做的
5. dpo如果正确和错误都下降怎么办
6. 分层强化学习要怎么具体设计agent的思路
7. reward怎么训练
8. reward hacking是怎么出现的,要怎么解决
9. 计算7b模型的占用
10. fddp和deepspeed怎么做显存优化
11. adamw中最占显存的是什么
12. 手撕一个MHA
#发面经攒人品##面试时最害怕被问到的问题##快手校招##大模型#
全部评论

相关推荐

09-10 20:58
已编辑
北京师范大学 算法工程师
啊啊啊!!不愧是字节 拷打的汗流浃背,最后算法题没为难 力扣hot100原题许愿许愿啊啊啊拷打项目&八股!(都是根据项目问的八股额啊啊啊):项目难点啊,轻耦合表现在哪啊,java的哪些特性实现了轻耦合啊,模块与模块之间怎么实现的轻耦合啊……spring依赖注入方案有哪些?Setter和基于接口的方案有啥区别?你用哪个?为什么?柔性事务相对刚性事务有什么区别?中间状态不一致为什么保持了强一致?tcp半包粘包?tcp报文段有规定体积吗?头部有规定体积吗?设计编码器是怎么解决半包粘包的?怎么判断这个包是不是属于这个包的开头部分……tcp重复和丢包是怎么处理的?怎么保证收到的是完整的?(长度和内容)udp实现IM的话应用层怎么保证安全和一致性呢?(重传部分问的很细((java集合的ArrayList和LinkedList有什么区别?内存部分有什么特点?应用场景有?Hashmap底层怎么实现的?什么时候扩展到红黑树?有什么优势?红黑树怎么保证平衡?场景题:用户同时保存下载100本小说,有进度提示,希望下载的越快越好,也希望保障手机的性能,可以从哪些点入手来实现?这样的item结构是啥样的?怎么更新下载状态?存到本地数据库要注意什么?为什么造成死锁?怎么解决?怎么设计锁?网络层层面怎么进行优化?……算法:删除链表的倒数第n个节点攒点人品希望至少能过一面
查看23道真题和解析
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务