字节大模型算法二面
字节抖音风控部门大模型算法二面
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
全部评论
佬,tiktok 还是抖音?
二面被狠狠拷打了
相关推荐
02-12 20:22
重庆大学 Java
双非后端失败第N人:1. go语言我建议你让ai带着你先把基本语法速通了,然后再去用go重新刷你以前刷过的leetcode,这样熟悉起来很快 2. 直接看你们组go项目,里面用***比较复杂,然后把每一个语法现象都喂给ai,一点点看
字节跳动公司福利 1371人发布 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看10道真题和解析