字节大模型算法二面

字节抖音风控部门大模型算法二面
1.自我介绍
2.手撕最长回文子序列
3.讲讲pytorch与TensorFlow的区别
4.分布式训练一般使用哪些pytorch函数
5.讲讲pytorch的fsdp与deepspeed的zero区别
6. 展开讲讲nccl的通信原语,例如gather、scatter之类的
7.场景题:训练一个模型,一张卡放不下去怎么办,可以使用多张卡。如果使用zero3,既然一张卡存放不下模型训练时候参数,那么模型参数更新的时候是怎么做的,使用什么方式能够让单卡更新模型参数?
8.讲讲dpo与kto的区别,ppo与grpo的区别
9.介绍下项目
10.简单讲讲你的论文
11. 反问业务、几面、后续流程之类的
#字节# #实习# #大模型# #算法#
全部评论
佬,tiktok 还是抖音?
点赞 回复 分享
发布于 今天 18:06 上海
二面被狠狠拷打了
点赞 回复 分享
发布于 今天 11:56 湖北

相关推荐

1、自我介绍2、Agent项目是实习项目还是个人项目?有没有上线?3、拷打实习(10min)4、大模型微调,你的训练数据集是如何构建的?数据量有多大?5、在构建数据集的过程中,遇到了哪些挑战?花了多长时间?6、你之前的实习经历偏后端工程,你未来的职业规划更倾向于纯后端开发,还是希望从事与AI/大模型结合的工作?7、详细讲一下Golang中Channel的概念和作用,它是否是并发安全的?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、讲一下GMP模型10、当P的本地队列为空或者不为空时,它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似淘宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明微信扫码登录的完整流程和背后发生的原理17、在微服务架构中,服务发现和负载均衡是如何实现的?18、服务注册中心(如Nacos, Consul)是如何工作的?服务实例如何注册和保活(如通过心跳机制)?19、讲一下Agent中的“长短期记忆”20、什么样的信息应该放在长期记忆,什么样的信息放在短期记忆?21、当对话轮数很多,上下文窗口不足时,有哪些处理策略?(如截断、压缩)22、如果要进行记忆压缩,通常有哪些方法?23、了解过Agent的设计范式吗?有哪些?24、你设计的Agent是怎么实现ReAct模式的?详细讲讲25、手撕:实现一个并发任务处理器:给定一个包含100个任务ID的列表,要求控制最大并发数为3,模拟并发调用某个外部接口(如打印ID)26、反问
查看24道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务