04-21 03:55 门头沟学院算法工程师

关注

阿里国际大模型算法一面分享 1h

压力拉满，考得比较深
1- 问项目
2- 为什么选择grpo不用sft，技术选型，什么时候用sft，什么时候用蒸馏，什么时候用grpo
3- grpo训练中观察什么指标
4- 八股：
5- grpo 的 loss 讲讲
6- Advangates 怎么算的，在整个训练中起什么作用，为什么需要Advatanges，直接用奖励去算不行吗？
7- 重要性采样，为什么需要。如果一次新策略和旧策略差别很大，那重要性采样还有用吗
8- grpo的kl散度和ppo的kl散度是一模一样的吗
9- ppo grpo 是on-policy还是off-policy
10- ppo中advantages是怎么得到的？
11- 信用分配，grpo中，比如一个采样结果，是序列级别的，如果这个序列的最终奖励高，那么是如何分配到每个token的
12- Agent 做多轮工具调用和单轮，可能有什么挑战？
13- code：x 的平方根（只保留整数部分）

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，写的很好呢

点赞回复分享

发布于 04-22 23:36 北京

05-07 19:09

三江学院 C++

AI Agent面经 5（持续更新）

Q1：规划和执⾏要不要拆开两个模型？答案：视任务⽽定。Planner-Executor 拆分可提升可控性（强模型规划、快模型执⾏）；单模型端到端更简单但易在⻓链路漂移。可混合：规划⽤强模型，执⾏层做确定性校验。Q2：如何避免 Agent 在⼯具调⽤间「迷失」？答案：明确 停⽌条件 与 最⼤步数维护 任务清单（todo） 与 当前⼦⽬标对每步输出要求 结构化（JSON）关键步骤 强制验证（单元测试式检查、⼆次 LLM 审核）Q3：结果冲突怎么整合？答案：优先级规则（权威源 > 时间新 > 多源⼀致）、让模型显式输出「冲突说明」、必要时触发⼈⼯。Q4：基于效⽤的 Agent 和基于⽬标...

大模型、Agent面试八...

点赞评论收藏

分享

05-04 20:38

同济大学 Java

找大模型算法实习-求助

bg中九本+c9硕 无竞赛无论文无实习，学了半个月搓了两个项目，目前八股还没背，力扣正在刷。想问问这个bg+项目能找到中小厂实习么，一直不敢投简历，怕被狠狠拷打。求大家给点意见第二个项目做rag是因为实在不知道做什么了，如果大家有推荐的开源项目就更好了，感谢！

点赞评论收藏

分享

05-05 16:10

华为_系统工程师

【面试真题】美团Agent 方向面经整理（思路引导 + 推荐回答）

Agent / LLM 方向面经整理（思路引导 + 推荐回答）  每章开头有一小段本章思路引导（这类题整体上在考什么、怎么组织话）。每道题下先有一行思路（答题时先想什么），再是推荐回答（可参考的表述骨架）。请把里面的名词、数字换成你项目里的真实情况，别整段背。  一、写在前面 如果投的岗位对后端技术栈有一两条要求，你没有相关经历但业务还是放了简历进来，最好针对 JD 里那两条单独准备一下。其实就算 JD 没写死，HTTP、流式、异步这类也算互联网底座，有时间还是摸一遍皮毛，面试里至少能接住话头、显得你是主动补过的人。 没正经后端经历的（比如我），体感是面试官一般不会往死里抠实现细节，更在意知识...

点赞评论收藏

分享

05-08 04:55

门头沟学院算法工程师

大模型算法面经分享-阿里暑期

继续来分享下最近的面经~欢迎友好讨论，信息共享1.项目背景2.要解决的问题3.要解决问题的难点4.技术方案选型5.最终如何确定技术方案6.Qwen3-VL embedding 是怎么做的7.是怎么提取图片的8.用的什么提取器9.最终怎么嵌入到文本里10.怎么定义 DPO 训练集是高质量的11.DPO 训练数据量是怎么确定的12.数据量确定是拍脑袋，还是有原则13.为什么不用 SFT14.SFT 数据质量要求高体现在哪些方面15.如果现在用 SFT 去解决这个问题，从理论上能不能解决16.为什么不用 GRPO 解决，而是选择 DPO

查看16道真题和解析

点赞评论收藏

分享

05-03 18:00

浙江大学算法工程师

哔哩哔哩大模型面试岗，我悟了！！！

哔哩哔哩大模型面试岗，我悟了！！！大家好，我是Yuki。周末跟一个在B站面试大模型算法实习岗的学员聊了整整两个小时，他说这场面试让他“一边冒汗一边开窍”。我让他把面试题完整复述了一遍，今天就把这场高质量的技术对话分享给大家。说实话，这几道题问得是真有水平——不是那种背八股文能应付的，而是实打实考察你做项目的深度和思考力。面试复盘：一场关于Agent的技术拷问第一关：你现在做的Agent到底是什么？面试官开门见山，没有废话。如果你回答“就是一个能调用工具的AI”，那基本就凉了。面试官要听的是：你对自己做的事情有没有系统性的理解。正确的打开方式是这样的：“我负责的是一个面向科研场景的辅助Agent...

查看9道真题和解析

点赞评论收藏

分享

评论

1

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何成为1个AI工程师？ #

6661次浏览 313人参与

# 秋招拿一个offer可以躺平吗 #

277716次浏览 1412人参与

# 26届春招投递记录 #

40787次浏览 352人参与

# 一人分享一个skill #

34749次浏览 317人参与

# 27届实习投递记录 #

127785次浏览 1438人参与

# 机械人求职现状 #

44038次浏览 329人参与

# 你觉得第一学历对求职有影响吗？ #

276783次浏览 1495人参与

# 我在大厂见过的最低学历 #

6391次浏览 69人参与

# 产品2023笔面经 #

89234次浏览 472人参与

# 第一次找实习，我建议__ #

87484次浏览 875人参与

# 秋招白月光 #

819370次浏览 5695人参与

# 虹软科技求职进展汇总 #

18514次浏览 141人参与

# 想给25届机械人的秋招建议 #

54322次浏览 264人参与

# 上班苦还是上学苦呢？ #

350635次浏览 2088人参与

# 给26届的秋招建议 #

391195次浏览 4407人参与

# 要毕业了，再不说就来不及了 #

11472次浏览 172人参与

# HR面都在聊什么？ #

48610次浏览 333人参与

# 机械人你觉得今年行情怎么样？ #

9837次浏览 100人参与

# 找工作中的意难平 #

1106224次浏览 6532人参与

# 运营来爆料 #

105983次浏览 519人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务