快递拆完即后悔专家

03-17 14:15 门头沟学院推荐算法

关注

字节一面

AI大模型算法，一环扣一环的拷打
Transformer 基础
详细介绍 Transformer 架构（Encoder-Decoder 结构、位置编码、FFN 等）
Decoder 的因果注意力中，Q、K、V 分别来自哪里？
→ Q 来自当前 Decoder 输入（已生成的 token 序列），K 和 V 也来自同一序列（需 mask 未来信息）
Attention 为什么要 scaled？不做会怎样？为什么是√dₖ？
→ 点积随 dₖ增大会让 softmax 进入饱和区，导致梯度消失；除以√dₖ可使方差稳定在 1（数学推导参考 Vaswani 论文）
Transformer 如何加速推理？KV Cache 是什么？训练 vs 推理的并行性差异？
→ 训练时所有 token 并行计算；推理时自回归，KV Cache 可缓存历史 K/V，避免重复计算，大幅提速

多模态论文深挖（以 Video-LLaMA 为例）
讲解 Video-LLaMA 的整体结构
→ 视频编码器（如 ViT + Temporal Aggregator）→ 投影层（对齐文本空间）→ LLaMA 语言模型
论文中 CoT（Chain-of-Thought）的具体设计？
→ 在 prompt 中加入推理步骤示例（如 “视频中先看到人挥手，然后狗跑过来…”），引导模型分步作答

微调 & 分布式训练
微调用了 LoRA，介绍其原理
→ 将权重更新 ΔW 分解为低秩矩阵 A×B，冻结原模型，只训练 A、B，大幅减少可训练参数
LoRA 初始化怎么做？秩（rank）设为多少？为什么选这个值？
→ A ~ N (0, σ²)，B 初始化为 0；常用 rank=8 或 16，在效果和参数量间取得平衡（实验验证）
知道 DeepSpeed 和 Megatron 吗？分别说说
→ DeepSpeed（微软）：主打 ZeRO 显存优化；Megatron-LM（NVIDIA）：张量并行 + 流水线并行
论文用 DeepSpeed，三个 Stage（ZeRO-1/2/3）分别是什么？
→ Stage1：优化器状态分片；Stage2：+ 梯度分片；Stage3：+ 模型参数分片（通信换显存）

二面下一篇再写吧，力竭了 #面试官最爱问的 AI 问题是......#

全部评论

推荐最新楼层

中国民航管理干部学院

点赞回复分享

发布于 03-17 15:54 江西

04-14 08:49

门头沟学院 C++

360 客户端开发一面(暑期)

1. 自我介绍2. 详细讲一下实习工作的内容3. 为什么一般说 RPC 性能优于 HTTP答案：严格来说，不能简单地说 RPC 一定优于 HTTP，更准确的说法是很多 RPC 框架在内部服务调用场景下通常比传统 HTTP/1.1 + 文本协议更高效。原因主要在于协议更轻、序列化更紧凑、连接复用更充分、接口定义更明确。很多 RPC 框架会使用 Protobuf 这类二进制序列化格式，相比 JSON 体积更小、解析更快；同时内部调用路径往往不需要那么多通用语义字段，报文开销更低。另外，RPC 框架通常把服务发现、负载均衡、超时控制、重试、熔断、链路追踪这些能力整合进去了，所以在工程上也更适合服务间...

C++ 常考面试题总结

点赞评论收藏

分享

04-12 01:30

门头沟学院算法工程师

字节27实习多模态大模型二面凉经

感觉面完人都通透了，还是太菜了，下去沉淀一下1.项目拷打，每个问题都很深很细节，问到你不会为止八股：1.attention怎么算？2.QKV和softmax公式；为什么要除根号d？除d行不行？3.grpo不同模型架构上训练的差异4.ppo的value model怎么做的？和actor model输出区别。手撕ppo，grpo公式，两者核心区别，advantage怎么算，kl怎么加。最后一些数据提纯和视频生成的场景题。

查看6道真题和解析

点赞评论收藏

分享

04-05 23:35

太原科技大学 Unity3D客户端

大梦龙途-游戏开发-一面面经

笔试1、现场做笔试，各方面问题都有一些，无算法题。记忆里牛客上有过它的笔试题，但现在找不到了，好像一直没变过。一面2、你工作里做过的重要的功能3、多少人做？重做还是优化？4、你有对红点系统了解吗？你会怎么设计？会有什么问题？5、海外本地化怎么控制的，直接在UI里面适配，还是写在代码里？6、一些独特的海外设计，如何避免因为合并分支导致冲突掉？7、一些特殊的海外资源怎么组织呢？一同放在项目里？（打包时替换成海外资源）8、各个分支的版本控制是如何组织的？9、UGUI常用的优化10、背包一百个格子和物品，怎么优化？11、无限滚动列表的实现？你们项目里无限列表的实现方式12、UGUI rebuild的整...

查看24道真题和解析

点赞评论收藏

分享

03-31 20:56

南京大学产品经理

IEG 游戏前沿技术产品策划值得去吗

楼主有大厂ai相关产品实习， 游戏前沿技术部门具体做啥的咋都搜不到呢，只有技术岗的帖子，有没有产品冈的能说下？略看了下感觉是做中台，不过这个岗位最近在狂发面试邀请吧，看到好几个了都

点赞评论收藏

分享

04-11 13:34

浙江大学算法工程师

金山 C++ 二面面经

1. 自我介绍二面里的自我介绍一般比一面更强调项目深度和岗位匹配，不需要讲太多基础课程，更建议重点说自己的项目经历、技术方向，以及为什么适合这个岗位。参考回答：面试官您好，我是 XX，目前主要方向是 C++ 后端开发。之前系统学习过 C++、操作系统、计算机网络、数据库等基础知识，也做过几个和服务端开发相关的项目，比如网络通信、高并发处理、线程池、缓存等方向的实践。在做项目过程中，我比较关注代码质量、性能优化和并发场景下的问题处理。这次也希望进一步和您交流一下我对 C++ 工程开发和系统设计方面的理解。2. 讲一个你项目中最有难度的问题，以及你是怎么解决的参考回答：这个问题在二面中很常见，面试...

C++八股文全集

点赞评论收藏

分享

评论

3

15

招聘动态

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

快手

27届实习超多转正机会

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

14383次浏览 155人参与

# 你觉得实习能学到东西吗 #

153352次浏览 1483人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

46300次浏览 509人参与

# 如果春招能重来，我会___ #

15929次浏览 184人参与

# 想做Agent可以做哪些岗位？ #

13489次浏览 420人参与

# 除了线上，还能去哪些地方投简历 #

9146次浏览 103人参与

# 九月了，是考研还是就业？ #

109867次浏览 610人参与

# 面试官拷打AI项目都会问什么？ #

13115次浏览 433人参与

# 你觉得最好用的AI编程工具是_ #

4980次浏览 98人参与

# 通信硬件薪资爆料 #

1318226次浏览 7290人参与

# 互联网公司评价 #

535393次浏览 4186人参与

# 金三银四，你的春招进行到哪个阶段了？ #

35885次浏览 334人参与

# 实习，不懂就问 #

214832次浏览 1709人参与

# 大厂还是考编 #

134827次浏览 1399人参与

# 反问环节如何提问 #

141453次浏览 2740人参与

# 你实习是赚钱了还是亏钱了？ #

128019次浏览 717人参与

# 实习第一天，你在干什么 #

9710次浏览 114人参与

# 机械人选offer，最看重什么？ #

181003次浏览 874人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

14193次浏览 80人参与

# 机械人的offer怎么选 #

284744次浏览 1262人参与

# 搜狐工作体验 #

6823次浏览 54人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务