字节大模型算法 实习 二面 人才库版
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
1.项目深挖
2.attention计算公式,为什么除以dk
3.ppo损失函数,解释,各部分是什么
4.mha、mqa、gqa、mla
5.交叉熵损失手撕
6.位置编码有哪些,rope
7.mse损失,gae损失,大模型里面怎么算
8.大模型里面的ppo,returns是什么
9.vit位置编码、二维位置编码、相对位置编码、多模态位置编码
全部评论
相关推荐
点赞 评论 收藏
分享
03-16 10:56
门头沟学院 Java 点赞 评论 收藏
分享
查看9道真题和解析