字节一面

AI大模型算法，一环扣一环的拷打
Transformer 基础
详细介绍 Transformer 架构（Encoder-Decoder 结构、位置编码、FFN 等）
Decoder 的因果注意力中，Q、K、V 分别来自哪里？
→ Q 来自当前 Decoder 输入（已生成的 token 序列），K 和 V 也来自同一序列（需 mask 未来信息）
Attention 为什么要 scaled？不做会怎样？为什么是√dₖ？
→ 点积随 dₖ增大会让 softmax 进入饱和区，导致梯度消失；除以√dₖ可使方差稳定在 1（数学推导参考 Vaswani 论文）
Transformer 如何加速推理？KV Cache 是什么？训练 vs 推理的并行性差异？
→ 训练时所有 token 并行计算；推理时自回归，KV Cache 可缓存历史 K/V，避免重复计算，大幅提速

多模态论文深挖（以 Video-LLaMA 为例）
讲解 Video-LLaMA 的整体结构
→ 视频编码器（如 ViT + Temporal Aggregator）→ 投影层（对齐文本空间）→ LLaMA 语言模型
论文中 CoT（Chain-of-Thought）的具体设计？
→ 在 prompt 中加入推理步骤示例（如 “视频中先看到人挥手，然后狗跑过来…”），引导模型分步作答

微调 & 分布式训练
微调用了 LoRA，介绍其原理
→ 将权重更新 ΔW 分解为低秩矩阵 A×B，冻结原模型，只训练 A、B，大幅减少可训练参数
LoRA 初始化怎么做？秩（rank）设为多少？为什么选这个值？
→ A ~ N (0, σ²)，B 初始化为 0；常用 rank=8 或 16，在效果和参数量间取得平衡（实验验证）
知道 DeepSpeed 和 Megatron 吗？分别说说
→ DeepSpeed（微软）：主打 ZeRO 显存优化；Megatron-LM（NVIDIA）：张量并行 + 流水线并行
论文用 DeepSpeed，三个 Stage（ZeRO-1/2/3）分别是什么？
→ Stage1：优化器状态分片；Stage2：+ 梯度分片；Stage3：+ 模型参数分片（通信换显存）

二面下一篇再写吧，力竭了 #面试官最爱问的 AI 问题是......#

全部评论

推荐最新楼层

寒丶

中国民航管理干部学院

点赞回复分享

发布于今天 15:54 江西

昨天 17:04

快手_后端开发实习生(实习员工)

腾讯二面

总时长35分钟，无手撕，感觉遇到KPI面了，唉35分钟一直在问实习，八股就问了下面的1.redis与数据库的缓存一致性2.redis的zset数据结构3.redis的两个持久化机制4.分布式cap理论5.什么时候ap，什么时候cp6.进程线程协程问怎么没手撕，说一面撕过了，业务是应用宝游戏商城，后面过了还有一面技术面，问面试表现，说挺顺的，可以再关注一下运维数据，然后问转go有难度嘛，就结束了

iiooz：别想太多了，面试官如果看不上，就不会约面了，腾讯很少所谓的kpi，有面就说明能力肯定不错，只是每个面试官筛选方式不同，二面甚至只跟你聊生活的都有，鹅还是很开放的在筛选人这一块

今天你投了哪些公司？

点赞评论收藏

03-15 21:49

广东工业大学 Java

本科四段大厂实习，暑期拿到wxg offer，终成鹅孝子

中国电信➡️滴滴出行➡️百度科技➡️腾讯

pangpang2：卧槽牛逼

看到电信就想到亿迅了，没想到真的是亿迅

我的实习求职记录

点赞评论收藏

今天 00:11

门头沟学院网络安全

面了三轮是绿牌还是蓝牌

面了三轮，两轮技术面➕hr面。今天刚面完hr，现在在录用评估了，面试的时候面试官说了这个是没有转正机会的（面向28届的岗位），岗位是在官网投递的，忘记问是绿牌还是蓝牌了，想问问这种有机会是蓝牌吗

今天你投了哪些公司？

点赞评论收藏

03-12 23:39

快手_后端开发实习生(实习员工)

腾讯暑期一面

一共一个小时，面试难度以及自己的回答算是最近的面试压力比较大的，实习问了30分钟，中间穿插八股。1.redis数据结构2.redis持久化机制3.mysql索引底层4.聚簇索引与非聚簇索引5.索引优化6.索引失效7.mysql执行一条sql8.那么多索引mysql怎么选（不会）9.tcp与udp区别10.tcp为什么可靠11.消息队列作用12.kafka怎么保证消息有序性13.mcp是什么？14.skills是什么？15.jvm内存分配与回收过程（我讲了从创建对象到判断垃圾对象到垃圾回收我全说了一遍，是这个吗？）16.fullgc触发机制17.tcp的拥塞控制流程（不会了）18.分布式事务解决方案，说了2pc，3pc，tcc。算法是反转双向链表，没有按格式输出，但是面试官没让继续写了，面完以为挂了，结果晚上秒过，看看复试什么情况吧。今天百度打电话准备发offer了，业务跟在手子的差不多，很垂，并且说不分日常暑期，只看表现，会有转正机会，但是考虑再三还是拒绝了，百度实习薪资确实有点低，title也不如之前了，但是面试的二位业务老师我很喜欢，对我的评价也不错，希望之后能有机会共事。从三月份到现在一共面了六家，面试次数总共是8场，情况如下：脉脉二面（无答复，默认挂）百度二面已oc美团一面过，下周一二面shein一面过直接HR面游族一面过直接HR面腾讯一面过等待约二面滴滴明天一面面试通过率还是蛮高的，但是大部分都是日常，感觉对我现在的加成不大，大概率不会去，不知道暑期会是什么情况呢唉，希望能有面试吧，继续加油。字节被无hc直接取消了，现在还没人捞，有没有字节HR救救我

不管什么都不想跳动了：本人美团百度快手都待过，建议肯定是直接留快手多一点产出后转正or直接冲字节腾讯暑期吧。一是快手从福利到基建都吊打另外两家。美团现在这个业务比较惨，本来毛利就很低，亏损严重，今年很可能要优化人力降低成本，去了别说日常，就算暑期后面都很可能被优化。百度其实实习生权限挺高的，可以接触到一些含金量高的项目，但是现在的风评不如之前了，薪资也不高。二是转正概率和薪资是跟产出挂钩的，你都在手子已经积累产出了，去其他家日常实习产出都是从0开始，肯定不可能有你在手子转正可能性大啊，现在日常压根没必要去，而且我有两个师弟都是在快手日常转正的，不用太担心，安心留在手子一边多做一点产出然后一边冲字节腾讯暑期，字节腾讯今年实习岗位非常多的，不如好好把握这个，加油。