字节多模态大模型日常实习一面分享

攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2.ppo和grpo区别,为什么不用grpo,dpo损失函数。
3.FSDP和DDP区别,对哪些做分片;Megatron以及其并行策略。
4.kv cache原理,vllm两个优化。
5.awq和gptq。
6.lora调参,位置编码,oom怎么办,activation checkpointing原理。
7.Qwen3-VL改进,目前多模态大模型一般架构。
8.一些cv基础问题。
9.手撕:最大四连通域(岛屿最大面积)
全部评论

相关推荐

03-31 14:46
已编辑
门头沟学院 Web前端
励志成为双港第一ja...:这其实很正常,离的太远了,他认为你不会来,就为了混个面试,而且成本很高,实习生都优先选本地高校。吃了地域的亏,所有很多时候地域可能比院校层次更重要。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务