字节 算法 一二三面
一面:讲一下论文。深挖了一下项目。讲一下强化学习reward函数设计。代码题一维卷积核矩阵,完整做出来了。
二面:讲一下论文。grpo和ppo的区别。大模型训练流程。拒绝采样数据处理怎么回事的。问了一下对自己的期待和未来职业规划。问了我的优点和缺点。没有编程题。
三面:讲一篇自己的论文。介绍项目。问了微调大模型如何卡阈值。为什么CLIP的嵌入效果不好?有什么解决办法。手撕了infonce代码。
许愿hr面。
二面:讲一下论文。grpo和ppo的区别。大模型训练流程。拒绝采样数据处理怎么回事的。问了一下对自己的期待和未来职业规划。问了我的优点和缺点。没有编程题。
三面:讲一篇自己的论文。介绍项目。问了微调大模型如何卡阈值。为什么CLIP的嵌入效果不好?有什么解决办法。手撕了infonce代码。
许愿hr面。
全部评论
想问下,是三面结束之后,两工作日没有约hr面的话,就是排序靠后或者挂了吗?
相关推荐
03-10 15:55
门头沟学院 Java 点赞 评论 收藏
分享
查看11道真题和解析