无论文勇闯秋招算法岗——淘天智能搜推部一面(复盘,草稿)
一共1h。
项目简单介绍。10min左右。
然后就是结合实习项目的 35min 的各种八股提问。
最后15min做题。给了三个题,我选的 岛屿的个数,hot100里边的。其它两个好像也是hot100里边的(有个三数之和)。
反问环节,是什么方向,搜索。
有什么面试建议,语速可以快一点(笑),这样可以聊更多的东西。
记录一下八股部分。
VideoMAE怎么训练的?
CLIP和MAE有什么区别?
BLIP的B什么意思?
BLIP2的qformer是怎么训练的?
有几个loss?
ITC和ITM的区别?
强化学习,GRPO和PPO的区别?
重要性采样是用来干嘛的?
拒绝采样和重要性采样有什么不同或者一样的地方?
flashattention解决的是什么问题?
Deepspeed 用的zero几,为什么用zero2不用zero3?
Eagle MTP的eagle2 和 3分别有什么改进?
整体感觉这边用的东西比较老,因为问的东西都很老,QwenVL完全没问,强化学习也问的很浅。
纯八股:
机器学习,SVM的HinGE loss,合页损失了解吗?
完全不知道。
拒绝采样:
图片来自:https://www.hmoonotes.org/2020/06/rejection-sampling-importance-sampling.html
采样步骤:
1.从q(x)中采样样本xi
2.以概率p(x)/Mq(x) 接受xi,其中M是一个常数,以确保p(x) <=Mq(x)
3.否则拒绝,重新采样
结合图像可直观感受到最后采样得到的样本一定是符合分布p的。
数学证明如下:
1.求X的联合概率密度,当X被接受且X在dx的时候,其概率密度为
2.总体的接受率为:
3.计算被接受的样本的分布,(p(x)/M)/(1/M) = p(x)
参考 https://blog.csdn.net/shizheng_Li/article/details/145826594