面面俱到神

2025-12-23 18:20 电子科技大学算法工程师

关注

蚂蚁大模型算法校招一面 50min

1.八股：介绍几种Attention（MHA，MQA，GQA）的区别
2.八股：分别讲一下Dense模型和MoE模型以及二者的区别
3.八股：讲一下MoE的路由机制是如何做的？
4.项目：介绍RAG项目，讲一下RAG项目的亮点
5.项目：如果召回的答案不是想要的，该怎么处理？
6.项目：讲一下BM25算法原理
7.项目：是否做过意图识别？如果要做意图识别，可以怎么实现？
8.项目：微调项目是如何模型选型
9.项目：如何做微调的？直接用 PEFT 库，还是用LLama Factory做的？
10.项目：讲一下DPO, PPO, GRPO的原理和区别，写一下DPO loss函数
11.代码题：lc15 三数之和

全部评论

推荐最新楼层

门头沟学院后端工程师

如果微调是用llamafactory会减分吗

点赞回复分享

发布于 2025-12-25 16:28 浙江

03-20 11:56

已编辑

一天一个AI项目｜多Agent助手实战

手把手带你拆解一个 GitHub 开源项目，用 LangGraph 从零搭建多 Agent 智能助手。Supervisor 架构 + 5 个专业子 Agent，代码不到 3000 行，适合写进简历的实战项目。    三、架构详解 用户消息 (Telegram / Slack) | v +---------------+ | Manager Agent | GPT-4o + SQLite记忆 +-------+-------+ | | SendMessage 工具（动态注入） | +-----+-----+-----+-----+ v v v v v 消息 日历 待办 协作 搜索 Agent A...

点赞评论收藏

分享

03-28 05:55

门头沟学院算法工程师

Shopee大模型算法一面（已过

攒人品中！ 1.项目拷打2.sft训到什么程度用rl3.sft的损失和预训练的损失有什么区别。4.构造sft专家轨迹之后会做什么操作5.grpo（ppo）和dpo的优缺点6.grpo的rm出现reward hacking有什么解决方法7.ppo和grpo的区别8.思维链冗余怎么处理，每个逻辑打是否冗余的标签？会出现什么问题9.滑动窗口最大化

查看9道真题和解析

点赞评论收藏

分享

03-22 14:55

广西大学算法工程师

拼多多 AI Agent 开发二面

1、项目里负责的边界是什么？哪些内容是亲手实现和验证的？2、如果要做一套可落地的 Agent 评测体系，整体怎么设计？评测一般要分离线和线上两层。离线评测解决“改动前后谁更好”，线上评测解决“真实用户下效果是否稳定”。离线侧我会先把样本按场景拆开，比如知识问答、工具调用、多轮追问、拒答场景、多语言场景、长文本场景，然后分别看回答正确率、工具调用成功率、检索命中率、拒答准确率和格式稳定性。线上侧看用户行为指标，比如首轮解决率、转人工率、二次追问率、平均耗时、token 成本和异常率。Agent 不能只看最终答案，通常要拆成三层指标：检索层、决策层、生成层。检索层看有没有召回正确证据，决策层看有没...

拼多多集团-PDD二面350人在聊

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

04-08 09:27

门头沟学院 Java

不是背了多少,而是用了多少

先给核心结论：Agent面试的核心逻辑，永远是「基础概念验证→落地能力验证→思考深度验证」，所有的问题都围绕这三层展开，面试官不是看你背了多少概念，是看你有没有真的把Agent用起来、有没有解决过真实的落地问题。下面分6大模块，把Agent面试的高频问题、回答核心要点、加分技巧，全给大家讲透，建议收藏。一、基础概念必问题（面试开场第一道门槛，答错直接凉）这类题是面试的敲门砖，主要验证你对Agent有没有基础认知，答错了基本一面就挂，回答核心是「讲清本质，结合自己的理解，别只背概念」。你理解的AI Agent是什么？和大模型对话、RAG应用有什么本质区别？1. 核心定义：AI Agent是能感知...

Agent面试会问什么？

点赞评论收藏

分享

评论

2

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

35700次浏览 442人参与

# 想从事Agent应该学习哪些技术？ #

8717次浏览 296人参与

# 有哪些公司在面试时考察AICoding？ #

19779次浏览 352人参与

# 你的第一家实习公司是什么档次？ #

70332次浏览 335人参与

# HR面都在聊什么？ #

13951次浏览 165人参与

# 大学生该如何认清当下的就业环境？ #

162574次浏览 889人参与

# 26届春招投递记录 #

3672次浏览 42人参与

# 从投递到OC，你用了多久 #

24166次浏览 241人参与

# 什么人最适合大厂？ #

12963次浏览 134人参与

# 哪些公司面试还在问八股？ #

14332次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23362次浏览 285人参与

# 我的求职进度条 #

1119264次浏览 8077人参与

# 如何快速融入团队？ #

50139次浏览 306人参与

# 校招生月薪1W算什么水平 #

143461次浏览 493人参与

# 你觉得什么岗位会被AI替代 #

57298次浏览 371人参与

# 多益网络工作体验 #

68604次浏览 310人参与

# 薪资爆料 #

412735次浏览 2209人参与

# 美团开奖 #

407854次浏览 1805人参与

# 运营来爆料 #

98855次浏览 508人参与

# 你觉得机械有必要实习吗 #

83707次浏览 529人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务