字节大模型算法实习一面 给我面没招了
给我面没招了,发点面经攒攒人品~
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论
相关推荐
查看21道真题和解析