03-07 09:25 门头沟学院推荐算法

关注

大模型算法实习面经-字节跳动

给我面没招了。。。
1. 项目拷打
2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。
3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。
4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。
5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。
6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。
7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。
8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。
9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。
10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。
11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。
12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。

全部评论

推荐最新楼层

明天当老板

北京工业大学算法工程师

问题怎么这么细

点赞回复分享

发布于 04-10 20:30 北京

03-26 09:27

门头沟学院 Java

AI时代岗位活路全景图

刷到这个话题，发现很多同学对AI时代的岗位认知，还停留在“AI能写代码=程序员要失业”的表层焦虑里。作为在AI行业摸爬滚打了一年的开发，结合行业现状和招聘市场的真实需求，今天给大家做一份完整的「AI时代岗位活路全景图」，分6大类讲清楚：哪些岗位不仅不会被AI替代，还会在AI浪潮里迎来长期红利，核心壁垒是什么，入行需要什么能力，全是干货，没有一句废话。先给一个最核心的底层逻辑：AI能替代的，是标准化、重复性、低决策成本的执行类工作；永远替代不了的，是需要非标准化、深度思考、复杂决策、业务理解、人性洞察的工作。判断一个岗位有没有活路，就看它的核心价值，是执行，还是思考与决策。一、AI原生核心赛道：...

你觉得什么岗位会被AI替...

点赞评论收藏

分享

03-26 12:52

门头沟学院算法工程师

AI infra应届春招

📍面试公司：小米🕐面试时间：2026/03/26（二十分钟草草收场，都不想去看结果就知道挂了）💻面试岗位：大模型推理优化❓面试问题：一、自我介绍二、八股问题拷打，其实上来就是手撕1、直接在编辑器上手撕MGA，要求写出init、forward、注意力层   ——丢人现眼了，基本不会写2、追问，不会写的话讲一下整个过程，输入到输出怎么样的？         ——讲了讲transformer，注意力机制3、vllm和sglang的底层代码有看过吗？                                          ——没看过（其实看过，但我不敢说，怕叫我写）4、kv cache有哪些加载方式？                                                        ——在胡言乱语，啊这个，啊那个5、PD分离机制是干什么的？你怎么实现的？                                   ——唯一能回答的问题6、有没有用vllm部署过模型？吞吐量是多少？                                 ——脑子昏了，沉默（跑了demo，没测过）7、MTP（可能是MCP？没听清）是什么，介绍一下？                     ——我估计想问Medusa？反正我没回答，沉默。到这他问不下去了。。。三、反问两个人尴尬一笑，没什么要问的了。🙌面试感想：应该是史上最无悬念的秒挂，第一个手撕不会之后我已经晕头转向了，加上昨天熬夜到五点，到后面我都有点不好意思了，感觉在浪费他的时间，在这里跟他道个歉😀。十月到现在算上开发+infra可能面了二十多家吧，大部分都是秒挂，感觉车企infra这块的要求都特别高吧，问的特别细，就是最新的技术一定都要掌握，这一块技术迭代感觉特别特别快，光背八股面经给我感觉不太行。鼠鼠也累了，但自觉已经尽力了。也感谢这些至少还给机会面试的公司吧，有些简历直接投垃圾桶里了。（希望下一届的同学早早准备，不要像鼠鼠一样还在为春招奔波）。

查看8道真题和解析

点赞评论收藏

分享

04-23 12:03

已编辑

南京航空航天大学算法工程师

26届春招寒武纪 AIGC推理框架研发工程师

2025.4.16，感谢信2025.4.13，二面，20minC++函数模板、规避内存泄露的方法torch compiler、cuda graph是否了解 ptx2026.3.25，一面，1h推理框架研发工程师岗位的理解降低大模型推理成本手段为什么要做算子融合cuda graph 原理、作用、使用场景3D 并行 & EP & CP & SP 原理、作用模型量化类型、原理、作用介绍MTPvllm的整体架构，请求在内部是如何流转的kvcache的空间如何计算prefix cache介绍vllm V0/V1 比较TP下，不同的模块如何汇总结果口述multi head atte...

查看19道真题和解析

点赞评论收藏

分享

04-14 22:38

东北大学 C++

快手ai infra二面

问简历 cutlass2.0 怎么实现grouped gemmfa3和fa4区别blackwell和hopper比有什么变化hang都有可能因为什么，分别要如何排查CUDA_DEVICE_MAX_CONNECTIONS能干什么，和launch bound什么关系寄

查看5道真题和解析

点赞评论收藏

分享

04-18 12:48

香港中文大学（深圳）人工智能

【暑期实习】华为 AI 工程师一面复盘

项目深挖很多，最后还有一道“手写”代码题这场华为 AI 工程师暑期实习的面试，整体节奏比较完整，基本就是“自我介绍—项目深挖—反问—代码题”这一套。刚开始先让我共享桌面，结合简历做自我介绍，讲自己的学习背景、做过的项目，以及现在的方向。前面这部分我还是按自己的主线来讲：山大本科电子和计算机双修，港中深硕士，方向慢慢转到 AI Infra、异构计算和性能优化；实习这边讲了之前做过的通用软件工程工作，以及现在做的算子优化和图优化相关内容。面试官前面没有特别打断，但后面几乎每一段都会继续往下追。项目里问得最多的，一个是我自己做的量化推理 runtime，另一个是现在在做的算子/图优化相关工作。量化项...

查看18道真题和解析

点赞评论收藏

分享

评论

1

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上如何体现你的“AI”能力？ #

14697次浏览 330人参与

# 选择和努力，哪个更重要？ #

207190次浏览 1551人参与

# 华泰星战营，提前锁定校招offer #

13224次浏览 389人参与

# 找不到大厂实习可以去小厂吗？ #

19961次浏览 223人参与

# 一人推荐一个值得去的通信/硬件公司 #

262206次浏览 2156人参与

# 没有面试的日子里，你在做什么 #

13149次浏览 358人参与

# vivo求职进展汇总 #

294946次浏览 1610人参与

# 找AI工作应该卷什么？ #

51913次浏览 280人参与

# 哪些AI项目值得做？ #

25000次浏览 610人参与

# 你总挂在第__面？ #

10477次浏览 117人参与

# 实习时最怕听到的一句话 #

22375次浏览 193人参与

# 非技术岗是怎么找实习的 #

333323次浏览 2654人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

200179次浏览 1186人参与

# 你的秋招第一场笔试是哪家 #

330238次浏览 2184人参与

# 秋招笔试记录 #

399699次浏览 2220人参与

# 硬件开发岗知多少 #

28062次浏览 154人参与

# 美团秋招笔试 #

213536次浏览 1183人参与

# 通信和硬件还有转码的必要吗 #

105576次浏览 642人参与

# AI Coding的使用心得 #

36211次浏览 243人参与

# 你简历上最心虚的一句话 #

20669次浏览 229人参与

# 你知道最慷慨和最抠的公司分别是 #

10424次浏览 85人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务