03-03 08:30 门头沟学院机器学习

关注

AI infra推理方向日常实习面经总结

攒人品攒人品～～
1.实习拷打
2.推理相关知识点：
1.transformer架构（encoder-only、decoder-only、encoder-decoder各自优缺点，模型举例）
2.prefill/decode 结合roofline讲
3.nv基础（grid、block、thread、warp、l0cache/l1cache(shared memory)/l2cache/global memory、sram/hbm、tensor core、tma等）
4.vllm相关（pagedattention、连续批处理、v0/v1架构、chunked prefill、prifix caching等）
5.sglang相关（radixattention，sglang代码没怎么看，问的不多）
flashattention v1-v3、flashdecoding
6.量化（LLM.int8()、SmoothQuant、AWQ、GPTQ等、量化的好处）
7.投机解码（什么是投机解码、lookahead、n-gram、medusa、eagle）
8.并行（dp/tp/pp/ep各自是什么，在vllm中如何实现）
9.通信（reduce、gather、开销考虑）
10.主流模型架构（llama1-3的演变、qwen3的moe怎么做的、deepseek的mtp）
11.kvcache压缩手段（MHA、MQA、GQA、MLA）
12.pd分离
3.其他知识点
计网、操作系统、python八股都很基础
4.手撕
leetcode：反转链表、链表重排（lc143）、中序遍历二叉树的递归和非递归实现、最长连续序列（lc128）
triton/cuda：layer norm、大矩阵规约求和、online-softmax

全部评论

推荐最新楼层

04-10 20:07

广西大学算法工程师

面壁智能大模型应用开发二面

1. 项目拷打 问的非常细 , 聊了30min2. GRPO 里的 reward 一般怎么设计，怎么避免模型学歪GRPO 的 reward 设计关键不是“打分越多维越好”，而是要保证相对排序真的有意义。常见做法是把 reward 拆成几部分，比如正确性、格式遵循、长度惩罚、拒答合理性、安全性这些，再做加权组合。对于推理任务，最核心的一般还是结果正确性和过程可验证性；对于开放式生成，还得控制风格漂移和模板化输出。真正难的是 reward hacking。模型很容易学会一些表面上拿高分、实际上没解决问题的套路，比如故意写很长、固定套模板、强行迎合裁判模型。所以 reward 设计通常不能只靠单一 ...

AI-Agent面试实战...

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

04-06 23:55

广西大学算法工程师

去哪儿大模型开发一面

1. 因果推断在多模态训练里能解决什么问题，为什么不是普通相关性学习就够了多模态场景里最容易出的问题就是模型学到“看起来相关”的捷径，而不是任务真正依赖的稳定因素。比如图像里某类背景、拍摄角度、文本描述习惯，可能和标签高度共现，但它们并不是真正决定结论的原因。因果推断的价值在于尽量把这些混杂因素拆出来，让模型更关注跨环境都稳定成立的信号。如果只靠相关性学习，训练集上可能效果很好，但一换数据源、设备、标注风格，性能就会掉得很厉害。因果思路不一定意味着一定要上完整的因果图模型，也可以体现在样本构造、环境分组训练、反事实增强和不变风险约束上。它本质上是在问：模型到底学到了可迁移规律，还是只记住了数据...

AI-Agent面试实战...

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

03-26 09:27

门头沟学院 Java

AI时代岗位活路全景图

刷到这个话题，发现很多同学对AI时代的岗位认知，还停留在“AI能写代码=程序员要失业”的表层焦虑里。作为在AI行业摸爬滚打了一年的开发，结合行业现状和招聘市场的真实需求，今天给大家做一份完整的「AI时代岗位活路全景图」，分6大类讲清楚：哪些岗位不仅不会被AI替代，还会在AI浪潮里迎来长期红利，核心壁垒是什么，入行需要什么能力，全是干货，没有一句废话。先给一个最核心的底层逻辑：AI能替代的，是标准化、重复性、低决策成本的执行类工作；永远替代不了的，是需要非标准化、深度思考、复杂决策、业务理解、人性洞察的工作。判断一个岗位有没有活路，就看它的核心价值，是执行，还是思考与决策。一、AI原生核心赛道：...

你觉得什么岗位会被AI替...

点赞评论收藏

分享

评论

3

22

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

61988次浏览 536人参与

# 机械笔面试考察这些知识点 #

17817次浏览 121人参与

# 商战，最累的是我们 #

31438次浏览 97人参与

# AI时代还有必要刷leetcode吗？ #

45856次浏览 550人参与

# 分享一个让你热爱工作的瞬间 #

69736次浏览 504人参与

# 米哈游笔试 #

671339次浏览 1207人参与

# 毕业租房也有小确幸 #

173443次浏览 4555人参与

# 字节7000实习来了，你投了吗？ #

42268次浏览 319人参与

# 想从事Agent应该学习哪些技术？ #

13311次浏览 379人参与

# 机械制造秋招总结 #

117694次浏览 927人参与

# 大学生该如何认清当下的就业环境？ #

165587次浏览 906人参与

# 国企/银行/研究所公司爆料 #

209039次浏览 917人参与

# 26届春招投递记录 #

4733次浏览 49人参与

# 有哪些公司在面试时考察AICoding？ #

26340次浏览 427人参与

# 实习必须要去大厂吗？ #

202156次浏览 1784人参与

# HR面都在聊什么？ #

20827次浏览 230人参与

# 初创公司值得加入吗？ #

44662次浏览 226人参与

# 春招什么时候投？ #

52391次浏览 709人参与

# 你都在哪些场所面过试？ #

80868次浏览 506人参与

# 你现在一天AI几次？ #

21935次浏览 147人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务