无论文勇闯秋招算法岗——淘天智能搜推部一面(复盘,草稿)

一共1h。

项目简单介绍。10min左右。

然后就是结合实习项目的 35min 的各种八股提问。

最后15min做题。给了三个题,我选的 岛屿的个数,hot100里边的。其它两个好像也是hot100里边的(有个三数之和)。

反问环节,是什么方向,搜索。

有什么面试建议,语速可以快一点(笑),这样可以聊更多的东西。

记录一下八股部分。

VideoMAE怎么训练的?

CLIP和MAE有什么区别?

BLIP和CLIP的区别?在 ITC的基础上引入了 ITM loss 和 LM loss,让模型可以进行文本生成。ITM loss是判断图文是否匹配,可辅助数据清洗。

BLIP的B什么意思?Bootstrapping (自举/自助),利用少量的高质量人工标注的数据,训练Captioner 和 Filter,前者负责给无文本或者带噪声文本的图片进行 caption 操作,Filter负责过滤低质量文本。经过 filt 的 web data 和 合成data 作为增强后的数据。

BLIP2的qformer是怎么训练的?

两阶段训练,stage1: ITC ITG ITM loss,其中 ITG loss 是直接用 QFormer 的text transformer做image caption,没有用到LM。

有几个loss?stage1: ITC ITG ITM loss 。stage2:自回归 交叉熵 loss。

ITC和ITM的区别?

强化学习,GRPO和PPO的区别?

重要性采样是用来干嘛的?

拒绝采样和重要性采样有什么不同或者一样的地方?

flashattention解决的是什么问题?

Deepspeed 用的zero几,为什么用zero2不用zero3?

Eagle MTP的eagle2 和 3分别有什么改进?

整体感觉这边用的东西比较老,因为问的东西都很老,QwenVL完全没问,强化学习也问的很浅。

纯八股:

机器学习,SVM的HinGE loss,合页损失了解吗?

完全不知道。

拒绝采样:

图片来自:https://www.hmoonotes.org/2020/06/rejection-sampling-importance-sampling.html

采样步骤:

1.从q(x)中采样样本xi

2.以概率p(x)/Mq(x) 接受xi,其中M是一个常数,以确保p(x) <=Mq(x)

3.否则拒绝,重新采样

结合图像可直观感受到最后采样得到的样本一定是符合分布p的。

数学证明如下:

1.求X的联合概率密度,当X被接受且X在dx的时候,其概率密度为

2.总体的接受率为:

3.计算被接受的样本的分布,(p(x)/M)/(1/M) = p(x)

参考 https://blog.csdn.net/shizheng_Li/article/details/145826594

重要性采样:

无论文勇闯秋招算法岗 文章被收录于专栏

无论文勇闯秋招算法岗 面试考点记录

全部评论
二面了吗
点赞 回复 分享
发布于 10-24 21:21 北京

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务