bug杀手锏 - 个人主页动态

04-13 02:55

感觉面完人都通透了，努力沉淀中1.Transformer 中 Attention 的本质是什么？从数学角度简要解释一下。2.在 Agent 多轮对话任务中，Attention 的局限性体现在哪里？3.SFT 的核心流程以及数据构建策略，SFT 之后常见的 Post-Training 有哪些？面试官专门问 DPO 和 PPO 区别，以及 GRPO 有没有用过。4.RAG 是什么，它和传统检索+生成的流程有何不同，如何评估一个 RAG 系统是否 work？5.有没有用过端到端的 RAG 评估框架，项目里的 Modular Agent 是怎么实现多步规划的？调度策略如何设计，有没有异常 fallback？6.手撕算法：岛屿数量（LeetCode 200）

查看7道真题和解析

0 点赞评论收藏

04-02 16:40

已编辑

昆明理工大学算法工程师

32 投 15 笔 4 面，我的笔试等待全经验分享

先上数据 投递 32家 2月下旬到3月上旬笔试 做了15场 含测评收到面试 4家第一场笔试 2月28日第一场面试 3月15日笔面间隔 15天具体经历2月底那周连着做了三场笔试 拼多多 美团 携程 一场接一场 做完人都是麻的然后就开始了漫长的等待3月初那几天 我每天刷牛客看别人笔试完多久约面 有人说三天 有人说一周 我等到第五天 邮箱除了广告啥也没有 等到第七天 开始怀疑是不是笔试挂了 等到第十天 已经做好全部石沉大海的准备了3月10号那天心态确实崩了一下 15场笔试换不来一场面试 说不怀疑自己是假的转折发生在3月15号下午两点我在图书馆刷题 手机震了一下 看了一眼 邮件加短信 某中厂 做云的 base北京 约一面看到面试邀请四个字的时候 我手抖了一下 不是因为激动 是等了太久 突然来了反而不敢相信 我把手机扣在桌上缓了十秒才拿起来仔细看然后3月16 17 18 三天连着来了3家 华为 荣耀 一个小厂 就跟公交车似的 等半天不来 一来来一串笔面间隔时间线 给大伙参考中厂A 笔试完第5天约面华为 笔试完第8天约面 性格测评后第3天荣耀 笔试完第11天约面小厂 笔试完第3天约面一点经验第一 笔试完别干等 把错题啃透等面试那15天 我把笔试做过的题全部过了一遍 尤其是编程题没AC的 不管是因为边界条件没处理好还是思路卡壳 我都重新理了一遍 在IDE里跑通才罢休 后来面试真的有被问到 笔试那道题你当时怎么想的 现在有没有更好的解法 如果不是提前复盘过 现场肯定卡壳第二 邮箱和短信都看 别漏了我有一家的短信进了拦截 邮件没提醒 幸亏那几天心里不踏实 每天手动翻一遍垃圾箱才发现 那家后来面到了二面第三 别跟别人比进度 没有意义我室友投得比我晚 面得比我早 那几天看他准备面试我还在等 确实难受 但后来想明白了 每个人投的岗位 部门 HC情况都不一样 别人三天约面不代表你挂了 我翻牛客去年的帖子 有人笔试完两周才收到面试 最后还是拿了offer第四 笔试做多了真的有肌肉记忆15场笔试不是白做的 到后面 选择题的八股套路基本摸清了 编程题的输入输出格式也不用反复试了 每场能省出10到15分钟给难题 最后拿到面试的那几家 我推测笔试成绩应该都不差 因为面试官在自我介绍时说了句 你笔试成绩还不错第五 记录每一场的笔试题我建了一个Excel 每场笔试完立刻记下考了哪些知识点 哪道题没做出来 哪个题做得不顺 15场记下来 发现考得最多的就是动态规划 二叉树 哈希表 后面我就重点刷这几类 命中率确实高了转化率供参考15场笔试 换 4个面试 转化率不到百分之27 按这个比例 如果你做了10场还没动静 可能不是你不行 是概率还没轮到你 再投几家 再做几场 总会来的最后整理了一个笔试复盘模板 需要自取公司名称：拼多多笔试日期：2月28日AC情况：2/3卡壳的题目:第三题动态规划卡壳原因：边界条件没处理好复盘后是否掌握：是祝我们都上！

做完笔试后你收到面试了吗...

0 点赞评论收藏

03-21 08:35

昆明理工大学算法工程师

查看14道真题和解析

0 点赞评论收藏

03-19 17:00

昆明理工大学算法工程师

查看7道真题和解析

0 点赞评论收藏

03-08 17:05

昆明理工大学算法工程师

八股文背了忘？试试"费曼学习法"

八股文背了忘忘了背，后来发现一个神器：给自己讲课每次学一个知识点（比如JVM垃圾回收），我就打开手机录音，假装在给小白讲课。"同学们，今天我们来学习JVM怎么打扫卫生……"讲完听一遍，卡壳的地方就是没掌握的。这个方法亲测有效，面试的时候被问到，直接脑子里自动播放录音！而且用自己的话讲出来，比死记硬背生动多了，面试官听着也不困。

交出你的校招焚诀

0 点赞评论收藏

03-06 14:50

昆明理工大学算法工程师

查看12道真题和解析

0 点赞评论收藏

03-04 13:31

昆明理工大学算法工程师

商汤大模型算法实习二面（已oc

继续来分享下之前的面经~欢迎友好讨论，信息共享1. 注意力机制2. LN和RMSNorm3. 长思维链了解吗？（不太了解4. 多模态了解吗？（不了解5. LoRA和 QLoRA？6. 多轮对话怎么处理（主包只是讲了讲自己的思路7. GRPO讲解一下

查看7道真题和解析

0 点赞评论收藏

03-01 01:30

昆明理工大学算法工程师

ai infra实习阿里云面经

大概四十分钟结束，聊家常一样项目拷打1. 你觉得现在llm推理瓶颈在哪。2. 问了我一个工作怎么建模互联的。3. 然后又对着这个工作挖了一些。4. 怎么看待未来硬件形态。5. 发文章怎么看

查看5道真题和解析

0 点赞评论收藏

02-28 21:00

昆明理工大学算法工程师

小马智行ai infra实习面经

被狠狠拷打了，发点面经攒攒人品1.什么是cudagraph。为什么cudagraph会用到更多的显存。推理的什么阶段更适合cudagrapho2.讲跨block的内部通信，warp原语。举一些warp原语的例子，讲讲都是什么。3.讲一下对nv芯片的ptx机器模型的认识。4.讲讲对cuda代码编译流程的认识。5.讲讲MLIR，以及为什么要设计MLIR出来6.手撕:归并排序

查看6道真题和解析

0 点赞评论收藏

02-26 04:15

昆明理工大学算法工程师

字节大模型算法实习一面

有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打：sam有哪几个组件 用的什么指标评价 模型性能横向相比大概什么水平3.transformer原理4.多头注意力5.为什么除以根号d6.多模态大模型一般有哪几个组件 什么作用7.手撕：m行n列矩阵，行内严格递增，找到这个矩阵里第k大的数

查看6道真题和解析

0 点赞评论收藏

02-11 22:25

昆明理工大学算法工程师

蚂蚁大模型LLM实习一面

1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少15.算法题：三数之和

查看15道真题和解析

0 点赞评论收藏

02-11 09:25

昆明理工大学算法工程师

查看5道真题和解析

0 点赞评论收藏

02-10 19:30

昆明理工大学算法工程师

星海图大模型后训练一面-实习面经

面了一个多小时，整体感觉还不错，欢迎佬交流～1.zero1232.你有没有实际对比过普通 DDP 和 ZeRO-1？比如 4 卡情况下，把 optimizer state 或 gradient 切成 shard 之后，显存大概能省多少？3.CPU offload4.BF 16 和 FP 165.在 DDP 多卡训练 中，通常一个 epoch 的定义是：所有 GPU 协同遍历一次完整数据集，且每个样本在该 epoch 内只被采样一次。但在实际训练中，我们往往是 按 step 数控制训练与保存 checkpoint 的，比如每 5000 step 保存一次模型，这样 checkpoint 很可能落在 某个 epoch 的中间。在恢复训练时，我们一般可以恢复 model optimizer lr step，但 DataLoader / Sampler 本身是无状态的，不会自动恢复到 epoch 中间的位置。在从一个 epoch 中间的 checkpoint 恢复训练时，有没有办法保证数据采样能够“无缝衔接”，继续完成当前 epoch，而不是重新打乱或重复采样数据？6.当 checkpoint 保存发生在 epoch 中间时，Trainer 是否能正确恢复 DataLoader 的采样状态？如果不能，工程上通常如何保证 resume 后的数据连续性？你是怎么实现的，是否用了 Accelerate或者huggingface 的Trainer7.DDP中当同时涉及 DataLoader 和 Sampler 时，shuffle 应该由哪一层来负责？8.PyTorch 的 DistributedSampler 内部是如何根据 num_replicas 和 rank 生成每个进程各自的数据 index 列表的？它如何在不进行进程间通信的前提下，确保多进程训练时样本划分互不重叠且覆盖完整数据集？9.GQA10.RMSNorm和LN11.在实际训练系统中，从吞吐量和资源利用的角度考虑，tokenization 更合理的放置位置是在 Dataset/DataLoader 阶段，还是作为模型 forward 前的一部分？12.手撕省份数量

查看11道真题和解析

0 点赞评论收藏

02-10 11:30

昆明理工大学算法工程师

查看9道真题和解析

0 点赞评论收藏

02-10 07:25

昆明理工大学算法工程师

查看8道真题和解析

0 点赞评论收藏

创作者周榜

关注他的用户也关注了：