字节大模型算法 实习 二面 人才库版

继续来分享下之前的面经~欢迎友好讨论,信息共享
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务