26秋招字节广告算法一面
1.实习介绍
2.面试官:挑个你做过的项目讲讲吧
有个比较有意思的reranker算法改进,面试官听了比较感兴趣中间穿插提问
3.手撕穿插八股
1)手撕交叉熵损失
2)二分类场景下,给定一个pred score数组,以及对应的label数组。模型只有一个预测值pc,且pred score[1....n]均等于pc,问pc等于多少时会收敛?
3)手撕transformer encoder+MHA
提问:为什么自注意力除以根号dk
提问:你写的norm是pre还是post?为什么使用pre
4)按照先行后列的方式遍历一个[100,10000]的数组和一个[10000,100]数组哪个更快?
5)给定一个房屋编号数组,给定一个路灯位置数组,要求路灯能照射到所有房屋,问:路灯的最小照射半径为多少?
2.面试官:挑个你做过的项目讲讲吧
有个比较有意思的reranker算法改进,面试官听了比较感兴趣中间穿插提问
3.手撕穿插八股
1)手撕交叉熵损失
2)二分类场景下,给定一个pred score数组,以及对应的label数组。模型只有一个预测值pc,且pred score[1....n]均等于pc,问pc等于多少时会收敛?
3)手撕transformer encoder+MHA
提问:为什么自注意力除以根号dk
提问:你写的norm是pre还是post?为什么使用pre
4)按照先行后列的方式遍历一个[100,10000]的数组和一个[10000,100]数组哪个更快?
5)给定一个房屋编号数组,给定一个路灯位置数组,要求路灯能照射到所有房屋,问:路灯的最小照射半径为多少?
全部评论
相关推荐
10-29 15:51
嘉应学院 Java 点赞 评论 收藏
分享
查看26道真题和解析