昨天 04:15 门头沟学院算法工程师

关注

阿里大模型算法暑期实习面经分享

继续来分享下最近的面经~欢迎友好讨论，信息共享
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋，还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题，从理论上能不能解决
16.为什么不用 GRPO 解决，而是选择 DPO
17.说一下目前强化学习的问题和解决思路

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

04-30 17:45

不愧是字节，问的好难啊🤯

本人简历上 1 个 RAG 项目 + 1 个 Agent demo；这次面的是AI岗一面前我以为：背完八股 + 把项目讲清楚，应该能稳过。0-5 min：自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的，痛点是大模型不懂行业术语。5-20 min：项目深挖（开始崩）- Q1：你的法律文档总共多少？切了多少个 chunk？- 我：约 500 份 PDF，5 万个 chunk- Q2：500 份 PDF 加起来才 5 万 chunk？平均每份 100 个 chunk，你切片粒度是多少？- 我：512 token- Q3：法律文档里"第三条第二款"和"第三条之二"是不同含义，你的切片会不会把它切散？- 我：（沉默 5 秒）……应该会- Q4：那你怎么解决？- 我：我可以加一个 metadata……（开始编）❌ 第一次崩：切片粒度没考虑业务语义。20-35 min：评测体系（继续崩）- Q：你怎么知道你的 RAG 有效？- 我：我用 Recall@5……- Q：评测集多少条？怎么构造的？- 我：100 条，我手工标注的- Q：100 条够吗？分布怎么样？- 我：分布……我没分- Q：那你的 Recall@5 是 0.81，你怎么知道这个数字是好是坏？baseline 是什么？- 我：（沉默 10 秒）❌ 第二次崩：没有 baseline，没分布分析，纯靠"看起来还行"。35-55 min：Agent 部分（彻底崩）- Q：你的 Agent demo 用了几个工具？- 我：3 个，搜索、计算器、文档查询- Q：当用户问一个问题，你的 Agent 怎么决定调哪个工具？- 我：用 ReAct，让模型自己决定- Q：模型决策错了怎么办？- 我：我加了个 reflection……- Q：reflection 失败 3 次后怎么处理？- 我：（沉默 15 秒）……我没想过❌ 第三次崩：异常路径完全没设计。55-65 min：业务理解 + 反问- Q：你觉得字节做 AI 应用最大的瓶颈是什么？- 我：算力？数据？- Q：你看过哪些字节最近发的 AI 产品？- 我：豆包、扣子……- Q：扣子是 Agent 平台还是工作流平台？- 我：（再次沉默）❌ 第四次崩：对面试公司业务一无所知。

面试官拷打AI项目都会问...

点赞评论收藏

分享

05-03 18:00

浙江大学算法工程师

哔哩哔哩大模型面试岗，我悟了！！！

哔哩哔哩大模型面试岗，我悟了！！！大家好，我是Yuki。周末跟一个在B站面试大模型算法实习岗的学员聊了整整两个小时，他说这场面试让他“一边冒汗一边开窍”。我让他把面试题完整复述了一遍，今天就把这场高质量的技术对话分享给大家。说实话，这几道题问得是真有水平——不是那种背八股文能应付的，而是实打实考察你做项目的深度和思考力。面试复盘：一场关于Agent的技术拷问第一关：你现在做的Agent到底是什么？面试官开门见山，没有废话。如果你回答“就是一个能调用工具的AI”，那基本就凉了。面试官要听的是：你对自己做的事情有没有系统性的理解。正确的打开方式是这样的：“我负责的是一个面向科研场景的辅助Agent...

查看9道真题和解析

点赞评论收藏

分享

昨天 14:30

门头沟学院算法工程师

字节27实习-大模型算法一面面经分享

继续来分享下最近的面经~欢迎友好讨论，信息共享论文1拷打：1.怎么判断这个视觉推理问题表现不足是encoder部分的问题还是后面llm推理的问题 追问怎么把图像转化为caption 不会透题吗 测评指标是什么2.单agent多能力和多agent相比的优劣势3.不确定性怎么量化的 还了解其他不确定性置信度的量化方法吗 什么原因让你再加入Top k token的分差 并且设置50%的占比计算不确定性 回答是一长串文本的话 哪一部分参与最后的不确定性计算4.辩论迭代机制怎么做的论文2拷打:1.衡量推理能力 怎么想到要这样设计这三个维度的题目2.怎么提高模型在回答这种问题的正确率 怎么让模型去挖掘这些关联关系手撕：二维有序矩阵查找指定值

点赞评论收藏

分享

04-12 12:38

广西大学算法工程师

小红书 AI Agent开发一面

1. 自我介绍2. 介绍你写的这个项目3. 为什么要做多 Agent，而不是把所有能力都塞进一个 Agent多 Agent 的核心价值不是“看起来更高级”，而是把复杂任务里的角色分工显式化。单 Agent 在任务很长、工具很多、约束很多的时候，容易把规划、检索、判断和执行混在一起，导致上下文污染、错误放大、调试困难。多 Agent 可以把流程拆成规划 Agent、检索 Agent、执行 Agent、审查 Agent，每个 Agent 只负责一类清晰目标，行为边界更稳定。但多 Agent 也不是默认更好。它会引入额外通信成本、状态同步复杂度和错误传播路径。真正适合多 Agent 的场景，一般满足...

AI-Agent面试实战...

点赞评论收藏

分享

04-29 19:33

上海交通大学算法工程师

字节面评脏

这种是面评脏了吗 被冻结了吗😭 该怎么自救呀

XxxxOxo：等半年以后解冻吧，没办法

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

20578次浏览 174人参与

# 上班苦还是上学苦呢？ #

345180次浏览 2069人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47639次浏览 515人参与

# 如果春招能重来，我会___ #

21389次浏览 225人参与

# 提名点击就挂的公司 #

144091次浏览 491人参与

# 除了线上，还能去哪些地方投简历 #

11431次浏览 115人参与

# 在爱玛，骑向未来 #

2082次浏览 206人参与

# 实习怎么做才有更好的产出 #

49900次浏览 456人参与

# AI coding的好用工具分享 #

88429次浏览 567人参与

# 字节开奖 #

150673次浏览 682人参与

# 找工作以来，你最看不惯__ #

79399次浏览 594人参与

# 大学四年该怎么过，才不算浪费时间？ #

23841次浏览 106人参与

# 面试等了一周没回复，还有戏吗 #

245957次浏览 1857人参与

# 字节7000实习来了，你投了吗？ #

55216次浏览 421人参与

# 毕业后不工作的日子里我在做什么 #

269094次浏览 1739人参与

# 薪资爆料 #

422299次浏览 2226人参与

# 我的秋招“寄”录 #

476349次浏览 3062人参与

# HR问：你期望的薪资是多少？如何回答 #

99326次浏览 833人参与

# 双非应该如何逆袭？ #

586032次浏览 6391人参与

# 双非本科求职如何逆袭 #

1648230次浏览 13078人参与

# 字节求职进展汇总 #

1847591次浏览 15402人参与

# 你觉得实习能学到东西吗 #

154106次浏览 1494人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务