字节AI算法实习一面分享 1h
发点面经攒攒人品~
八股:
1.qwen结构,引入了哪些技术
2.crossentropy
3.ppo dpo grpo都会深入问原理
4.vllm 如何加速,pageattention原理
5.layernorm batchnorm rmsnorm
6.attention公式 时间复杂度计算
7.lora常规八股,实战中微调的参数
手撕:分割等和子集
八股:
1.qwen结构,引入了哪些技术
2.crossentropy
3.ppo dpo grpo都会深入问原理
4.vllm 如何加速,pageattention原理
5.layernorm batchnorm rmsnorm
6.attention公式 时间复杂度计算
7.lora常规八股,实战中微调的参数
手撕:分割等和子集
全部评论
相关推荐
点赞 评论 收藏
分享