字节大模型算法二面

字节抖音风控部门大模型算法二面
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
全部评论
佬,tiktok 还是抖音?
点赞 回复 分享
发布于 02-09 18:06 上海
二面被狠狠拷打了
点赞 回复 分享
发布于 02-09 11:56 湖北

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务