熬夜一时爽一直熬夜一直爽

03-24 22:30 门头沟学院推荐算法

关注

美团大模型算法实习面经-攒人品中

攒攒人品！有面试过同岗的朋友欢迎评论区交流
实习拷打
1. 大模型微调中，如何解决蒸馏数据里“伪优质数据”（表面合规但实际存在误导性）的筛选问题？具体落地策略是什么？
2. Prompt迭代时，如何平衡“指令遵循率”和“业务适配性”？当两者冲突（比如按指令输出但不符合业务规范），你是怎么优化的？
3. 用LoRA做大模型微调时，遇到过过拟合/欠拟合问题吗？具体是怎么排查、解决的？对比全参微调，LoRA在解决这类问题时的优势和局限分别是什么？
4. 设计GRPO奖励函数时，当遇到跨场景需求，奖励权重如何动态调整？合规性的自动化评估，怎么适配不同场景的规范要求？
5. 如何通过业务反馈闭环（用户反馈），反哺模型微调、Prompt优化和数据筛选？举1个你实际处理过的Bad Case，说明完整优化链路。
八股
1. Self-Attention中Q/K/V各自作用？为什么要分开？
2. 把K换成Q（QQV）可行吗？为什么？

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-26 16:16 广东

03-24 20:58

阿里巴巴_淘宝_前端

聊一聊一些 Agent 项目的亮点（进阶）

引言大部分人简历上写的 Agent 项目，技术链路是这样的：接收用户输入 → 调 LLM → 解析工具调用 → 执行工具 → 返回结果。这是 Agent 的"最小可用版本"，能跑通，但没有任何区分度——2026 年了，跟着任何一个教程都能搭出来。尤其 RAG 相关的大家已经觉得烂大街了，评论区也有同学吐槽真正让面试官觉得"这个人做过真东西"的，是那些教程里不会教、但生产中必须解决的进阶问题。以下逐个拆解。一、Agent Harness：Agent 不是一个模型调用，是一个运行时是什么：Agent Harness 是 Agent 的"执行骨架&q...

简历中的项目经历要怎么写

点赞评论收藏

分享

03-30 16:32

吉林大学 Java

字节后端（大模型安全）实习二面面经（挺难绷的）

1. 自我介绍2. 项目介绍3. 用了什么锁来实现多进程的同步（项目相关，但是我也不知道他具体要问什么锁，所以继续询问具体问题）4. 讲了一遍Redis分布式锁的应用，但是他好像没听懂😅5. 再更加详细讲了一遍分布式锁的工作流程，似乎是不耐烦了直接写算法题6. 算法题是改版的压缩字符串，非力扣题目，需要将一个带有括号和数字的字符串展开，然后再压缩成没有括号的压缩字符串。数字表示重复次数。最后虽然思路对了但因为索引越界bug没A😓接下来还问了些八股：1. stringbuilder和stringbuffer的区别2. stringbuffer具体怎么实现的3. 他们两个哪个代价大4. 知道hashcode吗？Java里面hashcode具体怎么实现的？5. MySQL查询比较慢的原因可能有哪些？怎么优化？（能回答多少就说多少）接着就是问了些个人情况和反问环节总的来说，感觉很差。面试官自己晚到20分钟就算了，面试过程中还跟急着下班一样，想挂就挂呗还特地来刷一波KPI😓……最后过了好几天才发感谢信😅

查看10道真题和解析

点赞评论收藏

分享

03-27 11:40

门头沟学院算法工程师

蚂蚁实习大模型算法一面 1h

发点面经攒攒人品～1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集大模型相关八股提问4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少coding最小生成树

查看15道真题和解析

点赞评论收藏

分享

03-29 13:20

门头沟学院推荐算法

字节推荐算法一面分享-实习

发点面经攒攒人品～项目细节拷打八股1.大模型了解多少，强化学习了解什么2.DPO的全称是什么，公式是什么，直接体现在哪里3.与PPO对比归一化方法• 常用的归一化方法有哪些• 讲讲RMSNormAUC• auc的定义• 从样本里随机去掉一些负样本，Auc怎么变优化器• 讲一讲常用的优化器• sgd是什么，Adam相对于sgd改进了什么位置编码• 正余弦位置编码的公式

查看10道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

62285次浏览 536人参与

# 第一份工作应该选择高薪还是大平台 #

220217次浏览 1031人参与

# 校招第一份工作你干了多久？ #

149901次浏览 630人参与

# AI时代还有必要刷leetcode吗？ #

46605次浏览 555人参与

# 想从事Agent应该学习哪些技术？ #

13526次浏览 380人参与

# 大学生该如何认清当下的就业环境？ #

165721次浏览 907人参与

# 考公VS就业，你怎么选？ #

99739次浏览 520人参与

# 26届春招投递记录 #

4758次浏览 49人参与

# 字节7000实习来了，你投了吗？ #

42598次浏览 322人参与

# HR面都在聊什么？ #

21060次浏览 232人参与

# 有哪些公司在面试时考察AICoding？ #

26610次浏览 432人参与

# 小红书求职进展汇总 #

238286次浏览 1397人参与

# 校招生月薪1W算什么水平 #

143972次浏览 495人参与

# 毕业论文进行时 #

36336次浏览 172人参与

# 第一份工作应该选高薪还是热爱？ #

172373次浏览 1075人参与

# 联影求职进展汇总 #

176996次浏览 848人参与

# 美团开奖 #

408772次浏览 1809人参与

# 博世求职进展汇总 #

18951次浏览 64人参与

# 商战，最累的是我们 #

31490次浏览 98人参与

# 从投递到OC，你用了多久 #

35421次浏览 357人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务