算法打工人阿旺

2025-06-24 13:27 中山大学算法工程师发布于山东

关注

横扫腾讯/字节/PDD：2025大模型算法社招面经

1️⃣自我介绍
2️⃣项目拷打
这一部分决定了面试官对于你经验的评估，项目的理解要深一些，这个只能通过不断打磨完善项目经历。
✅微调项目：
1.业务背景
2.数据的构成，是否使用了合成数据
3.训练的过程中用了什么方法（为什么用这样的方式，用别的方式会有什么问题，是否尝试过）
4.如何评估整体的效果
5.微调之后是否还会出现幻觉的问题，出现了的话应该怎么处理
6.这个能力是否只能用在当前业务场景，是否可以作为一个通用的能力
7.是否尝试过用其他的基座模型
✅应用层项目：
1.业务背景
2.逻辑框架
3.优化前和优化后的能力差距
4.遇到最大的困难是什么？怎么解决的
是否还有别的优化方式
5.某个流程是否可以进行再优化
6.上线之后的效果反馈
3️⃣通识考察
（1）Transformers 和之前的模型的区别，为什么 Transformers 好？
（2）介绍下 Bert，框架，预训练和后续的微调任务？
（3）为什么 Bert 适合做向量模型，底层原理是什么？
（4）RoBERTa 做了什么优化？
（5）想要大模型输出的内容都为 json 格式，怎么实现？
（6）OOM 问题怎么处理
（7）大模型的参数量是怎么计算出来的？（8）DeepSeek R1 的训练方式，GRPO 的原理是什么？
（9）基于过程的强化学习和基于结果的强化学习的差异是什么？
（10）Agent 的概念是什么？整体流程是怎么样的？
（11）DeepSeek R1 对于 Agent 的能力是否有提升，如何进行运用？
（12）RAG 的整体流程和评估方式？
（13）如何解决 RAG 中信息覆盖率低、幻觉、逻辑计算的问题？
（14）大模型的数据合成应该怎么做？有哪些方式？
（15）DeepSpeed 的三个 stage 分别是什么？有什么作用？
（16）模型并行和数据并行的区别是什么？这两种方式的数据流和梯度是怎么更新的
4️⃣手撕代码
✅算法代码：
手写位置编码
手写多头注意力机制
Leetcode：
零钱兑换
最长递增子序列
打家劫舍
最长公共子序列
跳跃游戏
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

03-24 17:18

北京交通大学 .NET

字节在招哪些AI岗位？

给大家拆解一下事业部+岗位，看一线大厂是如何布局AI发展的 岗位详细清单与职责分析 一、技术研发类岗位 1. 大模型 Agent 技术专家 - AI 应用与创新 岗位 ID: 7419283793284565274 工作地点： 未明确指定 核心职责：  负责 LLM 工程化相关研发工作 构建 Agent 体系的技术架构 推动大模型在业务场景中的落地应用  任职要求：  3 年以上研发工作经验，本科及以上学历，计算机相关专业 具有 LLM 工程化相关研发经验 扎实的后台研发能力，熟练掌握 Golang/Java/Python 任一编程语言 熟悉 MySQL、ES 等常用基础组件 良好的设计能力、...

找AI工作可以去哪些公司...

点赞评论收藏

分享

03-28 11:30

门头沟学院算法工程师

智元机器人Agent一面攒人品中

给我面没招了，发点面经攒攒人品～Q1：你的 Agent 具备上下文记忆功能，基于 ReAct 模式，目前实际运行中最多能支持多少轮对话？Q2：在 ReAct 模式下，Agent 需要频繁调用工具。考虑到不同大模型（如 Kimi 支持 20 万+ token，DeepSeek 支持 10 万+ token）的上下文窗口限制，您在执行过程中是否遇到过因工具调用次数过多（N 次）导致 Token 超出限制（撑爆上下文）的情况？如果有，是如何处理的？Q3：在问答类场景中，如果 Agent 陷入死循环（例如反复搜索不到内容，不断重复“查看文件 - 搜索文件”的操作），有什么机制来检测并处理这种异常情况？Q4：项目基于 MCP 协议集成了服务器资源查询、数据操作和校内文档检索，为什么没有考虑集成外部互联网资源的检索能力？Q5：像 Codex 这类代码模型，其内部显然不是基于向量检索的。您是否研究或思考过 Codex 内部的文件检索策略是如何实现的？Q6：目前 OpenClaw 比较热门，您是否阅读过相关源码或研究过其技术实现？Q7：您提到了“服务器辅助开发”功能，是基于 Plan-Execute-RePlan 的方式实现的。能否详细讲解一下这一功能的具体实现逻辑？

查看7道真题和解析

点赞评论收藏

分享

03-30 08:20

门头沟学院算法工程师

高德agent组大模型应用算法凉经

发点面经攒攒人品～1. Query多个一级分类问题解决2.12 层Bert base参数量（0.1b）3. 为何不用轻量级大模型reranker模型4. 推理时batch size5. dpo训练是同时打压好坏样例的生成概率问题6.  Dpop的全称是什么7. 拷打项目8. leetcode 快排

倩雯雯：强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

查看8道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

03-30 10:20

门头沟学院算法工程师

阿里大模型应用算法强化学习方向面经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.项目拷打2.实习拷打3. 多轮对话超长上下文如何训练4. 上下文记忆策略5. Skills读取超长sop的优化有哪些trick

查看5道真题和解析

点赞评论收藏

分享

评论

1

26

全站热榜

更多

创作者周榜

更多

正在热议

更多

# Agent面试会问什么？ #

23146次浏览 834人参与

# 春招至今，你收到几个面试了？ #

62901次浏览 854人参与

# 厦门银行科技岗值不值得投 #

18309次浏览 419人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

7926次浏览 115人参与

# 一人分享一个skill #

5983次浏览 160人参与

# 烂工作和没工作哪个更痛苦？ #

16004次浏览 249人参与

# 巨人网络求职进展汇总 #

193508次浏览 1232人参与

# 面试体验最好和最差的公司 #

18985次浏览 141人参与

# 哪些公司一直卡在简历筛选 #

100015次浏览 305人参与

# AI替代不了什么？ #

10538次浏览 162人参与

# 我是XXX，请攻击我最薄弱的地方 #

71968次浏览 476人参与

# 现在入门AI首先要做什么？ #

3831次浏览 94人参与

# 实习心态崩了 #

113711次浏览 621人参与

# 拼多多工作体验 #

54911次浏览 373人参与

# 我们是不是被“优绩主义”绑架了？ #

43868次浏览 538人参与

# 我的求职进度条 #

974567次浏览 6484人参与

# 你觉得专业和学校哪个对薪资影响最大 #

104006次浏览 615人参与

# 说说你知道的学历厂 #

395913次浏览 1395人参与

# 你的秋招第一面感觉怎么样 #

145475次浏览 810人参与

# 你被哪些公司挂了？ #

173089次浏览 969人参与

# 你找工作想离家近 or 离家远？ #

46245次浏览 373人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务