大厂面经|字节大模型算法岗

✅一面
1️⃣深挖多模态论文
2️⃣介绍transformer架构
3️⃣详细说一下Decoder的因果注意力 QKV分别来自哪
4️⃣Attention为什么要做scaled 不做会怎么样 为什么用根号d_k
5️⃣Transformer怎么做加速训练(KV缓存) 训练和推理有什么区别(并行化)
6️⃣深挖多模态大模型论文用的video-llama 讲一下大模型的结构
7️⃣论文用了CoT讲一下论文的CoT是怎么样的
8️⃣微调用的LoRA介绍一下LoRA
9️⃣LoRA初始化怎么做的,用的秩是多少,为什么不选其他的数
1️⃣0️⃣知道deepspeed和megatron吗?分别介绍一下
1️⃣1️⃣论文用的deepspeed详细讲了一下三个stage分别是什么
✅二面
1️⃣深挖多模态和大模型的论文
2️⃣Decoder文本生成有哪几种方法
3️⃣还知道哪些多模态大模型
4️⃣介绍一下ALBEF、BLIP
5️⃣BLIP2的结构是什么  两阶段怎么训练的 有哪些损失
6️⃣知道PEFT吗 讲一下LoRA
7️⃣还有什么微调方法 -> prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的
8️⃣后面就是一些场景题
✅三面
1️⃣深挖论文
2️⃣讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的
3️⃣讲一下你用的大模型是什么结构 特征是怎么喂给大模型的
4️⃣大模型训练为什么不用SFT
5️⃣LoRA是什么?有什么好处
6️⃣知道RLHF吗?讲一下训练流程
7️⃣接下来就是好几个场景题,电商相关的,用大模型解决prompt应该怎么设计,怎么处理prompt的输出,怎么过滤错误格式的输出
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

07-21 17:12
已编辑
中山大学 全栈开发
积功德职位描述:1. 负责机器学习、深度学习等算法在得物业务场景的产品化工作2. 包括但不限于如下方向:目标检测,图像分割,图像分类,NLP,多模态,大模型等职位要求:1. 熟悉Linux环境开发,熟练掌握 Python 语言,有较强的编码能力2. 熟练使用一种深度学习框架如Pytorch、TensorFlow等,熟悉OpenCV、NumPy、Pandas等常用库3. 对云原生有一定了解,有容器化使用经验者优先4. 有GPU编程经验、熟悉算法模型部署、 TensorRT 优化工具者优先5. 图像处理、模式识别、计算机视觉、计算机图形学、机器学习等计算机相关专业在读研究生优先一面(2025.7.10)30minHR发给我的邮件是上午 11 点,我 11 点进会议等了半个多小时没人退出去了,12 点多的时候,HR微信联系我说怎么没进飞书会议,然后我赶紧爬起来进会议。。。搞忘了,日本和国内有一个小时时差,麻了。。。1. 面试官进来直接说你的简历我已经看过了,自我介绍一下吧2. 几乎是纯聊天。。。面试官说我的经历非常匹配(暗示)3. 大模型有没有推理优化经验?无,我说以前主要做CV算法,接触和使用过扩散模型,这也算CV大模型🤗4. 算法题:最大子数组和(秒了)5. 硕士研究内容?6. 偏向算法还是调度?有没有调度相关经验?无。。。7. 你们推理部署是怎么做的?我介绍了自己之前负责和参与过的GPU侧和端侧的推理部署8. 写过CUDA吗?熟不熟?学校里深入学过,之后因为业务关系,没啥使用场景,可以再捡起来9. 你还做过AIGC?有没有NLP相关经验?基本的概念和算法比如 tf-idf, n-gram,word2vec 这些都是知道的,做过文本分类任务,了解 Transformer、CLIP10. 有没有多卡推理优化经验?有多卡训练经验,多卡推理没做过。。。11. 问什么时候能来实习?答最快这月底就能到岗,3个月时间可以保证,每周5天12. 你知道岗位base地吗,能接受吗?我说就是期望在国内实习,上海完全能接受,表现出很想去的意愿🤣13. 反问:组内主要业务场景?商品内容理解、文本理解、AI鉴定商品真伪、推理优化等。学聪明了,面试官框框介绍完,我添一句“那还是挺期待的”🤣,疯狂暗示一面面试官貌似就是老大,结束后HR直接说过了,进offer流程。。。今年暑期准备就去这个了,主要是面试官和善,面试体验好、务实,其余都是次要的(没认真找,随便投投,攒攒面试经验,我觉得现在找工作看眼缘、看运气。本来想着回家吃饭睡觉的 日本饭好难吃啊。。。
查看11道真题和解析
点赞 评论 收藏
分享
1️⃣自我介绍:【⌚️10分钟】点评:流水账,有些磕磕绊绊,自我介绍环节的项目介绍的很详细,非常冗余。优化:写逐字稿,背诵,提升语言表达能力。2️⃣经常问题的问题优化:【⌚️20分钟】1:transform结构了解吗?回答点评:回答的很简单,5分吧,说了transform的结构是encode-decode结构,分块,每个块里面有四个组建,MHA、FFN、LN、残差链接,介绍和理解不深刻。提升指导:梳理回答逻辑结构,讲解MHA、FFN、LN、残差链接的添加逻辑和含义,其中MHA给出代码层面理解,从2分钟的回答变成6分钟的回答。2:多头自注意力机制是啥?公式是啥?代码你会写吗?回答点评:讲了公式,但是掌握的不够细致,pytorch代码框架不熟悉,attention_mask机制没有写出来。提升指导:讲述代码的原理,如何使用代码回答问题,展示自己的理解深刻。3:rag中的多路召回是什么?embeding为啥用智源的BGE-large/Base?回答点评:使用了BM25和向量召回,但是没有讲出来两个的区别和联系提升指导:先讲原理,再讲述下语义理解能力和泛化能力的区别,计算的效率,两个互为补充等。3️⃣不会回答的问题指导:【⌚️40分钟】1:  LN不太会回答,看网上的回答很多,但是不是理解层面。2:我的向量召回是faiss做的,和这个相关的问题我如何准备?3:经常会被问到rag用的啥框架,这个问题如何回答?还需要准备框架的知识吗?4:面试官经常问我,rag的模型是啥?有做微调吗?如果不做微调怎么回答?5:大模型还需要补充那些知识?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看8道真题和解析
点赞 评论 收藏
分享
评论
11
62
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务