字节大模型算法实习一面 给我面没招了

给我面没招了,发点面经攒攒人品~
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论

相关推荐

03-08 18:11
门头沟学院 Java
想要实习的牛:这么牛逼的简历都吃瘪吗🌚那我不寄了
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务