算法打工人小旺

08-06 12:29 中山大学算法工程师发布于山东

关注

淘天多模态大模型面经

✅一面
1．首先是自我介绍和过项目，面试官还一起探讨项目用到的方法，可行性之类的
2．介绍一下 CLIP
3．了解 LoRA 吗， LoRA 微调的原理是什么
4．了解哪些多模态大模型，简要介绍几个
5.BLIP的三个损失函数分别是什么，数据是怎样清洗的
6.BLIP2相对于 BLIP 有哪些改进，BLIP3又有哪些改进
7.Qwen- VL 的三个训练流程分别是什么，有什么作用
8．视觉编码器和 LLM 连接时，使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好，说说各自的优缺点
9．代码：实现多头自注意力
一面比较常规，几乎都是八股问题，我觉得只要了解常见的多模态大模型都问题不大，主要还是要理解各个模型设计的动机是什么，这也是面试最喜欢考察的
✅二面
1．自我介绍和过项目，简要问了项目中使用某些方法的动机，以及是否会导致其他的问题
2．了解 Transformer 吗，编码器和解码器的注意力有什么区别，在计算注意力中时除以 dk \ sqrt { d _ k }\ sqrt [ d _ k ｝的原因是什么
3．后来有哪些比较经典的基于 Transformer 的语言模型， Qwen 相比于原始 Transformer 有哪些结构上的改动，Qwen2又有哪些改进
4．了解 RLHF 吗， DPO 和 PPO 有什么区别， Loss 是什么样的，各自的优缺点是什么
5．介绍一下 CLIP ，还了解什么其他的对比学习方法
6．开放题：了解哪些多模态大模型，目前多模态大模型最的问题是什么
7．代码：1143．最长公共子序列
二面其实也偏常规，几乎也都是八股问题，但是也考察了一些对模型的理解以及知识面的广度，整体来说比一面的难度大一些
✅三面：
1．自我介绍，然后详细过了一下项目
2．了解哪些大模型和多模态大模型，然后就聊了大模型这一路是怎么发展过来的，
Transformer 、 BERT 、 GPT 、 LLaMA 、 Qwen ix ,以及当时的o1推理模型
3．平常有尝试过训练过大模型吗，规模小一点的也没关系
4．聊天，包括职业规划等等
三面比较轻松，面试官说知识点前面两面都考察过了，三面就轻松一些，大概40来分钟吧
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

昨天 16:33

门头沟学院 Java

秋招收到的第一个意向书，太激动了

码农索隆：很好，你很棒，但是.... 我举报了！！！

字节跳动开奖367人在聊

点赞评论收藏

分享

07-17 12:42

上海对外经贸大学推荐算法

大模型应用面试内容每家都不一样，不知道怎么准备了。。

第一家：教育行业。后端研发(AI 多模态)问实习比较多。llm的微调部署这些没问，主要是项目实现。Transformer八股。但是后面说进公司要学Java第二家：游戏数据公司。AI应用开发。也是问实习内容，同样没问llm的微调部署，主要是项目实现。后来问面试反馈，说我做的太底层，他们想招聘偏应用的。第三家：车企。大模型算法。偏应用但是主要问八股。lora、MoE这种内容很多，根本记不下来。而且这几次面试我投的都是同一份简历，但是面试问的问题差的很多。最近几个月准备时间也不短，但是越准备要学的东西越多了。。。

点赞评论收藏

分享

07-17 22:36

中山大学算法工程师

抖音大模型｜社招3轮面经

1️⃣抖音一面1、聊项目。2、AUC的两种公式是？你能证明这两种等价的吗？3、BERT-CRF中，为什么要加CRF？好处是？4、self-attention为什么要用QKV三个矩阵，不用有什么问题？有没有哪个模型的Q和K矩阵是一样的？5、reinforce属于on-policy还是off-policy？为什么？6、reinforce带上baseline好处是？reinforce的loss写一下？7、策略梯度会推导吗？简单写一下？8、代码题（代码题一般别着急写，先跟面试官说下思路，确定了再写）：lc 46，全排列（lc表示leetcode，下同）。lc 73，矩阵置0。2️⃣抖音二面1、介绍项目。2、知识蒸馏有哪几种？你觉得哪种效果最好？3、nlp的数据增强方法，主要有哪几种？每一种举个例子？4、分类的损失函数为什么是交叉熵而不是mse？5、BERT对输入文本的长度有什么限制，为什么要限制长度呢？6、BigBird里面有哪几种注意力机制？相比原始transformer的self-attention的优势？7、场景题：如何根据拼多多的商品数量，估计淘宝的商品数量？8、给出emb_size, max_len, vocab_size, ff_inner_size，num_heads, 12层，求BERT参数量。9、代码题：n皇后问题。3️⃣抖音三面‍1、简单聊项目。2、CRF和HMM区别？CRF为什么比HMM效果好？3、如果BERT词表很大，比如vocab_size达到几百万，怎么办？4、快速手写一些transformer的mha（多头注意力），伪代码意思一下就行。5、为什么对比学习中，temperature很小，而知识蒸馏的temperature比较大？6、你觉得在抖音买东西，和淘宝、拼多多他们的区别是？（我没在抖音买过，就只能现场编。）7、你最近看到过哪些paper？简单介绍下？8、你觉得自己有那些优缺点？平时喜欢怎么缓解压力？📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看26道真题和解析

点赞评论收藏

分享

08-06 22:01

中北大学 Python

大智慧 NLP算法一面面经

合肥的一个做数据服务的公司主要问了一些项目之前做QA客服用的切块方法召回策略数据清洗的一些工作方法 去重的时候怎么操作能够减少去去掉非重复数据给一份企业报告怎么构建RAG给大模型让其找到正确章节里面的内容构建RAG的文档分块策略聊了聊市面上的一些大模型厂商 多模态大模型和NLP大模型的区别如何构建Agent或者WorkFolw实现一些自动化闲聊昨天OpenAI开源模型了人工智能未来的发展方向

查看8道真题和解析

点赞评论收藏

分享

08-05 21:59

门头沟学院 Java

真的快，这就收满了

#腾讯#  #字节#  #秋招投递攻略#  #哪个瞬间让你对大厂祛魅了？#

秋招投递攻略

点赞评论收藏

分享

评论

4

15

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的秋招“寄”录 #

5268次浏览 80人参与

# 每个月的工资都是怎么分配的？ #

58208次浏览 562人参与

# 去哪儿旅行秋招 #

221336次浏览 3161人参与

# 实习的内耗时刻 #

11282次浏览 161人参与

# 你上一次给父母打电话是什么时候 #

4906次浏览 57人参与

# 独居后，你的生活是更好了还是更差了？ #

3697次浏览 67人参与

# 腾讯大前端岗位热招中 #

13600次浏览 147人参与

# 入职第二天，午饭怎么解决 #

26289次浏览 75人参与

# 规定下班时间vs实际下班时间 #

7250次浏览 57人参与

# 工作上你捅过哪些篓子？ #

5594次浏览 38人参与

# 深信服求职进展汇总 #

209549次浏览 1724人参与

# 得物求职进展汇总 #

103500次浏览 826人参与

# 视觉/交互/设计百问百答 #

52493次浏览 442人参与

# 你觉得材料多少算高薪 #

22054次浏览 148人参与

# 今年形式下双非本找得到工作吗 #

207304次浏览 1281人参与

# 秋招笔面试记录 #

98816次浏览 1878人参与

# 奇葩时刻大赏 #

56771次浏览 237人参与

# 央国企投递记录 #

98941次浏览 1409人参与

# 你们公司哪个部门最累？ #

29794次浏览 214人参与

# 秋招想进国企该如何准备 #

80761次浏览 439人参与

# 美团秋招笔试 #

63538次浏览 405人参与

# tplink提前批进度交流 #

195110次浏览 1477人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务