氛围很轻松:阿里淘天多模态大模型算法岗

✅一面
1.首先是自我介绍和过项目,面试官还一起探讨项目用到的方法,可行性之类的
2.介绍一下 CLIP
3.了解 LoRA 吗,LoRA 微调的原理是什么
4.了解哪些多模态大模型,简要介绍几个
5.BLIP 的三个损失函数分别是什么,数据是怎样清洗的
6.BLIP2 相对于 BLIP 有哪些改进,BLIP3 又有哪些改进
7.Qwen-VL 的三个训练流程分别是什么,有什么作用
8.视觉编码器和 LLM 连接时,使用 BLIP2 中 Q-Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好,说说各自的优缺点
9.代码:实现多头自注意力
✴️一面比较常规,几乎都是八股问题,我觉得只要了解常见的多模态大模型都问题不大,主要还是要理解各个模型设计的动机是什么,这也是面试最喜欢考察的
✅二面
1.自我介绍和过项目,简要问了项目中使用某些方法的动机,以及是否会导致其他的问题
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别,在计算注意力中时除以 \sqrt{d_k} 的原因是什么
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始 Transformer 有哪些结构上的改动,Qwen2 又有哪些改进
4.了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143. 最长公共子序列
✴️二面其实也偏常规,几乎也都是八股问题,但是也考察了一些对模型的理解以及知识面的广度,整体来说比一面的难度大一些
✅三面
1.自我介绍,然后详细过了一下项目
2.了解哪些大模型和多模态大模型,然后就聊了大模型这一路是怎么发展过来的,Transformer、BERT、GPT、LLaMA、Qwen 这些,以及当时的 o1 推理模型
3.平常有尝试过训练过大模型吗,规模小一点的也没关系
4.聊天,包括职业规划等等
✴️三面比较轻松,面试官说知识点前面两面都考察过了,三面就轻松一些,大概40来分钟吧
📳**************************************。

全部评论
大佬有论文吗
点赞 回复 分享
发布于 06-05 17:55 浙江
三面过了吗?
点赞 回复 分享
发布于 06-05 15:33 上海
佬是硕士吗
点赞 回复 分享
发布于 06-05 02:45 山东

相关推荐

地狱难度😭楼主四月中左右开始做这方面的准备,非计科的,学校里数据结构一点没学过,刷了半个月左右的力扣加八股,面了一个月左右,已成耐面王字节:两次一面挂😭(然后说我面评还不错还要捞我,被我拒了,感觉面了也是没戏)快手:4.11一面 4.25二面 5.9三面 横向挂(挂的时候还鞭我尸,挂完之后说再让我等等,老师们要再讨论一下,讨论完还是给我挂了😡)腾讯:wxg:4.25一面,过了约节后二面,结果节后没算法hc了(被26届的抢了),只有开发hc了,我说算了不搞开发5.15被wxg安全捞了,约了16号面试,结果面试前一小时取消,也是hc被26届抢没了😭5.20被IEG捞了,5.22一面,5.23二面,5.27三面,5.30四面,6.13offer(已拒)华为:笔试免,5.29测评,测评完约了5.29技术交流,约了6.5一面,拒了(华为的HR真的特别特别好,我当时已经收到网易oc了,说不想参与后续面试了,HR说那边可以尽快推进流程,还可以每次面试都告诉我结果,只要过了直接oc,相当于提前给口头offer,下次一定选华为😭,真的是我见过最好的HR姐姐)网易伏羲:5.19一面,5.20二面,5.26三面,5.28 oc,6.3 offer(已接)---入职一周了,组里氛围特别好,mt人也特别好,不卷时长,但工作时大家都很高效(早10晚6点半还有两小时午休,我入职第二天九点半到,发现部门一个人都没有我就知道我来对了😋)
我的OC时间线
点赞 评论 收藏
分享
评论
4
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务