2024-08-21 15:56 已编辑门头沟学院 C++ 发布于北京

关注

抖音电商训推岗凉经

bg

一段芯片厂推理框架开发实习

一个推理框架开发的项目

一面

一面的面试官是搞算法的，可能对推理相关的内容了解的不多，主要是针对CUDA的内容问的，比如内存模型，加速方法等，不算深入。顺便还考了一个softmax的CUDA手撕。

其他的就是针对简历上提到的一些工作进行了提问，因为面试官本身也了解不深入，所以算是给他回答一些疑惑。

手撕除了上面说到的CUDA，还有LC19删除链表的倒数第N个节点。

二面

一开始就是对项目和实习进行了询问，属于聊天型的。

然后从简历出发，考了一些八股，flash attention、attention的计算复杂度，llama模型结构，为什么注意力分数计算要除以根号d，KV cache的压缩方法。

比较常规的八股，但是问的很浅，比如KV cache压缩方法中，我提到说知道MQA和GQA，然后也没深入问。还问到了分布式训练的内容，我提到说相关的论文都看过，但是没有实际经验。其实除了上面提到的八股，其他问题都是问我知不知道，无论知道还是不知道都没有再深入问。

面试官给提了两点建议：要实际跑一下分布式训练（我的大多数工作都是推理，训练只看过论文），然后要对tensorRT-llm熟悉（只深入看过vllm，tensorRT-llm确实了解的不多）。

手撕是LC215数组中的第K个最大元素。

本来以为秋招更看重的是基础，面试官给提的建议可以下来后慢慢学，没想到这两条建议实际上给判了死刑。在反问的时候面试官建议我投AML，想想也是很明显的暗示了。

HR反馈说面评都很不错，感觉还是岗位匹配度不够吧，通过反问猜到这个业务的HC应该不会多，可能更希望候选者能够尽可能的匹配，而我又没有训练的经验，因此挂了。其实说来应该还有一个原因，面试官提到目前的业务是一个正式工和一个实习生，面试开始的时候也问了我能不能实习的一些问题，感觉是比较缺马上能干活的人。

#字节跳动##面经##大模型推理##大模型训练#

全部评论

推荐最新楼层

英军而汤包

西安交通大学算法工程师

抖音➕电商，双bug有点卷

5 回复分享

发布于 2024-08-21 23:30 黑龙江

VIVO校招内推官

vivo_HR(准入职员工)

好难

1 回复分享

发布于 2024-08-22 23:25 黑龙江

牛客937384162号

门头沟学院算法工程师

老哥方便问下什么学历？

点赞回复分享

发布于 2024-09-01 11:21 福建

门头沟学院 C++

点赞回复分享

发布于 2024-08-21 21:28 四川

03-20 12:11

蚌埠坦克学院 Java

暑期第一面-快手27留用实习

闲聊幂等相关问题多线程相关问题。Java中的HashMap、ConcurrentHashMap实现原理为什么MySQL使用B+树？慢SQL如何优化？介绍实习中的ES的同步是怎么做的手撕：LRU缓存 输出没搞好，给面试官说了下思路就OK了。 过年玩的太嗨了，面试的状态还不是很好，很多地方思路很乱，面试官感觉也对我的实习不太感兴趣，没聊几句就手撕了。

查看5道真题和解析

点赞评论收藏

分享

03-25 22:45

江南大学 golang

快手AI infra(偏推理)暑期留用实习，一面

1.拷打项目推理框架算子如何优化的如何构建Memory pool的如何对框架进行测试的？数据量有多少2.八股Vllm的page attention了解吗？chunk prefill是如何实现的？continous batching了解吗？3.leetcode二维数组每行有序，求第K小的元素（prioirty_queue，只写出来暴力）

查看7道真题和解析

点赞评论收藏

分享

03-27 16:33

百度_测试开发实习生(实习员工)

0327快手转正实习测开一面

聊工作和研究生生活项目与实习的区别聊实习大概做了什么，介绍一下业务聊大模型相关，对ai赋能测试的一些体感了解针对智能生成测试用例这个平台手撕最长回文子串 没最后撕出来，但是给我讲了可以用递归。面试官人很好很温柔，整体聊的挺好的，但是不知道会不会挂我，因为之前聊很好也挂了。

查看5道真题和解析

点赞评论收藏

分享

03-17 14:15

门头沟学院推荐算法

AI大模型算法，一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构（Encoder-Decoder 结构、位置编码、FFN 等）Decoder 的因果注意力中，Q、K、V 分别来自哪里？→ Q 来自当前 Decoder 输入（已生成的 token 序列），K 和 V 也来自同一序列（需 mask 未来信息）Attention 为什么要 scaled？不做会怎样？为什么是√dₖ？→ 点积随 dₖ增大会让 softmax 进入饱和区，导致梯度消失；除以√dₖ可使方差稳定在 1（数学推导参考 Vaswani 论文）Transformer 如何加速推理？KV Cache 是什么？训练 vs 推理的并行性差异？→ 训练时所有 token 并行计算；推理时自回归，KV Cache 可缓存历史 K/V，避免重复计算，大幅提速多模态论文深挖（以 Video-LLaMA 为例）讲解 Video-LLaMA 的整体结构→ 视频编码器（如 ViT + Temporal Aggregator）→ 投影层（对齐文本空间）→ LLaMA 语言模型论文中 CoT（Chain-of-Thought）的具体设计？→ 在 prompt 中加入推理步骤示例（如 “视频中先看到人挥手，然后狗跑过来…”），引导模型分步作答微调 & 分布式训练微调用了 LoRA，介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B，冻结原模型，只训练 A、B，大幅减少可训练参数LoRA 初始化怎么做？秩（rank）设为多少？为什么选这个值？→ A ~ N (0, σ²)，B 初始化为 0；常用 rank=8 或 16，在效果和参数量间取得平衡（实验验证）知道 DeepSpeed 和 Megatron 吗？分别说说→ DeepSpeed（微软）：主打 ZeRO 显存优化；Megatron-LM（NVIDIA）：张量并行 + 流水线并行论文用 DeepSpeed，三个 Stage（ZeRO-1/2/3）分别是什么？→ Stage1：优化器状态分片；Stage2：+ 梯度分片；Stage3：+ 模型参数分片（通信换显存）二面下一篇再写吧，力竭了

查看10道真题和解析

点赞评论收藏

分享

03-17 16:37

门头沟学院 Java

百度三面凉经

1. 为什么想要考研2. 读研后觉得达到当初预期了吗3. 讲一讲实习等等等4. 线上有遇到什么问题吗，怎么解决的5. 目前哪些公司还在流程中6. 使用过哪些AI coding，说一说感受7. 说一说IOC和AOP吧8. 说一说蒸馏9. 说一说RAG10. 说一说Skill和Rule聊天挺开心的，面完一小时HR说挂了。暑期实习真难找啊。

查看10道真题和解析

点赞评论收藏

分享

评论

5

16

招聘动态

客路2026产研校招

AI网申助手

网申字段一键填写

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

27届校招宝典

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试被问到不会的问题，你怎么应对？ #

20681次浏览 507人参与

# 学历VS实习，哪个更重要？ #

792次浏览 30人参与

# 招商银行数字金融训练营 #

106053次浏览 915人参与

# 你见过哪些招聘隐形歧视？ #

21476次浏览 186人参与

# 设计人的面试记录 #

204965次浏览 1630人参与

# 你觉得大几开始实习最合适？ #

24048次浏览 240人参与

# 厦门银行科技岗值不值得投 #

15197次浏览 352人参与

# uu们，春招你还来吗？ #

59444次浏览 627人参与

# 面试中，你被问过哪些奇葩问题？ #

94551次浏览 1166人参与

# 哔哩哔哩笔试 #

34661次浏览 140人参与

# 影石Insta360求职进展汇总 #

183949次浏览 1377人参与

# 国企/银行/研究所公司爆料 #

203341次浏览 913人参与

# 你都用vibe coding做过什么？ #

17874次浏览 711人参与

# 供应链/物流校招攻略 #

12391次浏览 218人参与

# 虹软科技求职进展汇总 #

16619次浏览 138人参与

# AI Coding实战技巧 #

12748次浏览 270人参与

# 机械人还在等华为开奖吗？ #

325155次浏览 1599人参与

# 做完笔试后你收到面试了吗？ #

23636次浏览 210人参与

# 恒生电子笔试 #

19877次浏览 155人参与

# 你现在一天AI几次？ #

10760次浏览 118人参与

# Vibe Coding 会干掉初级岗位吗？ #

19711次浏览 211人参与

# 如果人生可以debug你会改哪一行? #

9206次浏览 139人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务