字节大模型算法二面
字节抖音风控部门大模型算法二面
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
全部评论
佬,tiktok 还是抖音?
二面被狠狠拷打了
相关推荐
等闲_:把mt的写上,还有我感觉也不咋用包装,把业务讲清楚就行,面试官也不是不清楚实习生会干啥 点赞 评论 收藏
分享
查看24道真题和解析