无论文勇闯秋招算法岗——淘天智能搜推部一面(复盘,草稿)
一共1h。
项目简单介绍。10min左右。
然后就是结合实习项目的 35min 的各种八股提问。
最后15min做题。给了三个题,我选的 岛屿的个数,hot100里边的。其它两个好像也是hot100里边的(有个三数之和)。
反问环节,是什么方向,搜索。
有什么面试建议,语速可以快一点(笑),这样可以聊更多的东西。
记录一下八股部分。
VideoMAE怎么训练的?
CLIP和MAE有什么区别?
BLIP和CLIP的区别?在 ITC的基础上引入了 ITM loss 和 LM loss,让模型可以进行文本生成。ITM loss是判断图文是否匹配,可辅助数据清洗。
BLIP的B什么意思?Bootstrapping (自举/自助),利用少量的高质量人工标注的数据,训练Captioner 和 Filter,前者负责给无文本或者带噪声文本的图片进行 caption 操作,Filter负责过滤低质量文本。经过 filt 的 web data 和 合成data 作为增强后的数据。
BLIP2的qformer是怎么训练的?
两阶段训练,stage1: ITC ITG ITM loss,其中 ITG loss 是直接用 QFormer 的text transformer做image caption,没有用到LM。
有几个loss?stage1: ITC ITG ITM loss 。stage2:自回归 交叉熵 loss。
ITC和ITM的区别?
强化学习,GRPO和PPO的区别?
重要性采样是用来干嘛的?
拒绝采样和重要性采样有什么不同或者一样的地方?
flashattention解决的是什么问题?
Deepspeed 用的zero几,为什么用zero2不用zero3?
Eagle MTP的eagle2 和 3分别有什么改进?
整体感觉这边用的东西比较老,因为问的东西都很老,QwenVL完全没问,强化学习也问的很浅。
纯八股:
机器学习,SVM的HinGE loss,合页损失了解吗?
完全不知道。
拒绝采样:
图片来自:https://www.hmoonotes.org/2020/06/rejection-sampling-importance-sampling.html
采样步骤:
1.从q(x)中采样样本xi
2.以概率p(x)/Mq(x) 接受xi,其中M是一个常数,以确保p(x) <=Mq(x)
3.否则拒绝,重新采样
结合图像可直观感受到最后采样得到的样本一定是符合分布p的。
数学证明如下:
1.求X的联合概率密度,当X被接受且X在dx的时候,其概率密度为
2.总体的接受率为:
3.计算被接受的样本的分布,(p(x)/M)/(1/M) = p(x)
参考 https://blog.csdn.net/shizheng_Li/article/details/145826594
重要性采样:
无论文勇闯秋招算法岗 面试考点记录
查看15道真题和解析