一只爱飞翔的猪

10-19 11:04 已编辑北京理工大学算法工程师发布于北京

关注

无论文勇闯秋招算法岗——淘天智能搜推部一面（复盘，草稿）

一共1h。

项目简单介绍。10min左右。

然后就是结合实习项目的 35min 的各种八股提问。

最后15min做题。给了三个题，我选的岛屿的个数，hot100里边的。其它两个好像也是hot100里边的（有个三数之和）。

反问环节，是什么方向，搜索。

有什么面试建议，语速可以快一点（笑），这样可以聊更多的东西。

记录一下八股部分。

VideoMAE怎么训练的？

CLIP和MAE有什么区别？

BLIP和CLIP的区别？在 ITC的基础上引入了 ITM loss 和 LM loss，让模型可以进行文本生成。ITM loss是判断图文是否匹配，可辅助数据清洗。

BLIP的B什么意思？Bootstrapping （自举/自助）,利用少量的高质量人工标注的数据，训练Captioner 和 Filter，前者负责给无文本或者带噪声文本的图片进行 caption 操作，Filter负责过滤低质量文本。经过 filt 的 web data 和合成data 作为增强后的数据。

BLIP2的qformer是怎么训练的？

两阶段训练，stage1: ITC ITG ITM loss，其中 ITG loss 是直接用 QFormer 的text transformer做image caption，没有用到LM。

有几个loss？stage1: ITC ITG ITM loss 。stage2:自回归交叉熵 loss。

ITC和ITM的区别？

强化学习，GRPO和PPO的区别？

重要性采样是用来干嘛的？

拒绝采样和重要性采样有什么不同或者一样的地方？

flashattention解决的是什么问题？

Deepspeed 用的zero几，为什么用zero2不用zero3？

Eagle MTP的eagle2 和 3分别有什么改进？

整体感觉这边用的东西比较老，因为问的东西都很老，QwenVL完全没问，强化学习也问的很浅。

纯八股：

机器学习，SVM的HinGE loss，合页损失了解吗？

完全不知道。

拒绝采样：

图片来自：https://www.hmoonotes.org/2020/06/rejection-sampling-importance-sampling.html

采样步骤：

1.从q(x)中采样样本xi

2.以概率p(x)/Mq(x) 接受xi，其中M是一个常数，以确保p(x) <=Mq(x)

3.否则拒绝，重新采样

结合图像可直观感受到最后采样得到的样本一定是符合分布p的。

数学证明如下：

1.求X的联合概率密度，当X被接受且X在dx的时候，其概率密度为

2.总体的接受率为：

3.计算被接受的样本的分布，(p(x)/M)/(1/M) = p(x)

参考 https://blog.csdn.net/shizheng_Li/article/details/145826594

重要性采样：

无论文勇闯秋招算法岗文章被收录于专栏

无论文勇闯秋招算法岗面试考点记录

全部评论

推荐最新楼层

做个有文化的流氓

门头沟学院安卓

二面了吗

点赞回复分享

发布于 10-24 21:21 北京

10-24 14:24

门头沟学院算法工程师

字节算法一面凉经

岗位偏多模态、内容理解写面经，攒人品1. 从实习项目中提问八股（1）视频数据是如何采样的？抽几帧？分辨率多少？（2）采样后的数据是如何过模型的？（3）用的什么模型？介绍一下？（4）了解其他的多模态大模型吗？介绍一下？（5）介绍一下transformer的结构？（6）介绍一下multihead-attention?（7）multihead-attention为什么要切分？为什么要做成多头的？（8）你觉得多头注意力能提高计算效率吗？结合公式推导一下？（矩阵计算）（9）不能提高计算效率，详细讲讲为什么？（10）multihead-attention现在有一些优化，现在主流的优化都有哪些方向，每个方向...

查看15道真题和解析

点赞评论收藏

分享

10-16 21:17

门头沟学院 Java

小红书算法实习面经

1. 手撕最大岛屿面积，没撕出来，面试官改成再让撕快速排序2. 介绍召回3. itemcf 相似度公式4. din模型结构5. 介绍推荐系统链路6. 每个阶段都知道哪些模型7. 反问业务面试准备不多，但小红书是我很想去的公司，刚开始找实习就投了，面邀来的很快，再多点时间准备就好了

查看7道真题和解析

点赞评论收藏

分享

10-25 11:47

北京理工大学算法工程师

无论文勇闯秋招算法岗——文远知行一面

整体的沟通不是很顺畅，面试官一直在纠结项目背景，我说是技术预研，他一直问有没有业务背景自驾的强化学习和llm的不太一样他们是传统的RL，也不是多模态问了一些项目，面试官好像不太懂问了我几个问题GRPO的优化目标？KL散度的作用，为什么要KL散度？为什么有些论文移除了KL散度？这样会不会灾难性遗忘？GRPO比PPO的优势，我说移除了reward model，以及去掉了value model。但是面试官不是很满意，说这不是GRPO主要的改进。工作比较flexible考了一个leetcode.162（把这题理解为爬坡，当num[mid] <num[mid+1] 说明是往右的一个上坡，left=...

查看6道真题和解析

点赞评论收藏

分享

10-25 00:13

大连理工大学结算

收到offer光顾着开心了，但是把三方协议寄给对方公司后有将近10多天没有任何回应，会毁约吗。第一次

#牛客AI配图神器##牛客在线求助答疑中心##应届生被毁约被毁意向了怎么办#

应届生被毁约被毁意向了怎...

点赞评论收藏

分享

10-19 23:10

门头沟学院后端工程师

中兴普通批软件开发岗

1、自我介绍，问本硕成绩、奖项、发表情况，期望工作地点，求职倾向 2、项目的难点和解决方案、实习情况 3、RAG的效果从哪些地方可以优化 4、什么是RAG的前检索、中检索、后检索 5、对tensorflow的了解 6、什么是C++的智能指针，用在哪里 7、用没用过Qt 8、期望薪资（因为不打算去，随口报了20k，面试官说我要少了），有无其他offer

查看8道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 校招生月薪1W算什么水平 #

34743次浏览 191人参与

# 哪一瞬间觉得自己长大了 #

38303次浏览 493人参与

# “vivo”个offer #

38993次浏览 280人参与

# 如果上班像打游戏，你最想解锁什么技能 #

8260次浏览 70人参与

# vivo工作体验 #

27990次浏览 124人参与

# 为了实习逃课值吗？ #

28845次浏览 271人参与

# 工作后明白的那些道理 #

21805次浏览 225人参与

# 一人一个landing小技巧 #

123951次浏览 1447人参与

# 我是面试官，请用一句话让我破防 #

26737次浏览 128人参与

# 实习最想跑路的瞬间 #

87541次浏览 543人参与

# 中美关税战对我们有哪些影响 #

43104次浏览 361人参与

# 机械制造2023笔面经 #

149645次浏览 840人参与

# 如果重来一次你还会读研吗 #

201703次浏览 1932人参与

# AI时代，哪些岗位最容易被淘汰 #

3422次浏览 27人参与

# 中美关系回暖，你会选择出海吗？ #

6804次浏览 107人参与

# 华为保温 #

107775次浏览 408人参与

# 哪些行业值得去? #

5449次浏览 50人参与

# i人适合做什么工作 #

11507次浏览 97人参与

# 美团开奖 #

223263次浏览 1152人参与

# 读研or工作，哪个性价比更高？ #

78326次浏览 769人参与

# 如果秋招能重来，我会____ #

37667次浏览 301人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务