算法打工人阿旺

03-14 23:05 中山大学算法工程师发布于山东

关注

拼多多大模型一二面面经

【一面】
1）介绍一个最能代表自己的项目
2）项目里负责的边界是什么？哪些内容是亲手实现／验证的？
3）电商领域预训练数据：低质过滤与去重会怎么做？用哪些简单指标快速判断数据质量？
4) Pretrain 和 SFT 分别解决什么问题？
5) Transformer 的基本结构怎么理解？
6）多模态模型的大致结构是什么（图像编码器+连接层+ LLM )？最容易踩坑的点通常在哪里？
7) SFT 数据如何更贴近业务：如何避免过度模板化？如何做基础的 train / test 去重来避免评测失真？
8）对齐（ RLHF / DPO 等）整体思路是什么：为什么需要偏好对／奖励信号？
【二面】
1）做过的最有影响力的一件事是什么？具体推动了什么变化？
2）训练不稳定怎么排查（ loss NaN 、 OOM 、吞吐下降）
3) Long Context 常见思路有哪些？在业务里如何做"能看长文本但不太贵"的折中（摘要／分段／滑窗等）?
4）如何做一套简单可执行的离线评测集？如何覆盖不同语言与类目？
5）多模态场景怎么评估：如何检查"图文一致性／不编造信息"？优先加哪些自动化检查？
6) Prompt ／模板如何管理：如何版本化、如何回滚、如何避免一次改动导致整体波动？
7) 手撕：实现一个最简单的 top - k 采样（给定 logits ／概率，取 top - k 后重新归一化采样），并说明边界情况怎么处理。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

重庆邮电大学 Java

听说拼多多双机位，真这么吓人吗

1 回复分享

发布于 03-19 13:47 重庆

拼多多内推成功率高

上海华东师范大学 C++

要实习机会的可以看我帖子，我们组大量hc，转正机会大，帮跟进进度 27实习：https://careers.pddglobalhr.com/campus/intern?t=IEBgwcvcEG 26春招：https://careers.pddglobalhr.com/campus/grad?t=6UAcxoddUi

点赞回复分享

发布于 03-26 21:37 上海

04-07 09:44

浙江大学算法工程师

高德地图-汽车业务-C++开发-一面面经

1. 实习期间主要负责什么模块？遇到过最难解决的问题是什么？怎么解决的？这类问题考察实际动手能力和解决问题的思路。回答时建议用 STAR 法则：背景（做什么项目）、任务（负责哪块）、行动（怎么做的）、结果（效果如何）。重点突出：主动承担的部分、遇到的技术难点、自己的思考过程，而不是只描述"我参与了某某项目"。如果有跨团队协作经验，也可以提一下沟通协调的方式。2. 项目中有没有用到多线程？如何保证线程安全？多线程是汽车业务中高频场景，比如地图数据加载、定位信息更新、路径规划并发计算等。线程安全的常见手段：互斥锁（mutex）：保护共享资源，注意避免死锁，推荐用 lock_gu...

查看14道真题和解析

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

03-22 14:55

广西大学算法工程师

拼多多 AI Agent 开发二面

1、项目里负责的边界是什么？哪些内容是亲手实现和验证的？2、如果要做一套可落地的 Agent 评测体系，整体怎么设计？评测一般要分离线和线上两层。离线评测解决“改动前后谁更好”，线上评测解决“真实用户下效果是否稳定”。离线侧我会先把样本按场景拆开，比如知识问答、工具调用、多轮追问、拒答场景、多语言场景、长文本场景，然后分别看回答正确率、工具调用成功率、检索命中率、拒答准确率和格式稳定性。线上侧看用户行为指标，比如首轮解决率、转人工率、二次追问率、平均耗时、token 成本和异常率。Agent 不能只看最终答案，通常要拆成三层指标：检索层、决策层、生成层。检索层看有没有召回正确证据，决策层看有没...

拼多多集团-PDD二面350人在聊

点赞评论收藏

分享

03-30 18:50

门头沟学院 Java

腾讯实习-agent开发一面-攒人品

给我面没招了，发点面经攒攒人品～1. 实习拷打2. 项目拷打3. 你的检索是否基于向量实现，搭建完整的 RAG 系统会涉及哪些核心部分？4. RAG 项目的文档上传和分块是怎么实现的？5. 向量检索召回的单次耗时是多久，有没有用到Rerank模型？6. 你如何评估检索召回内容与用户问题的匹配度，有没有做相关的效果评估？7. 你对 Agent 的理解是什么，它包含哪些核心模块？8. 是否了解 Agent 的设计范式，例如ReAct 范式？9. 你的 Agent 循环一般多少步可以完成任务，有没有出现过达到最大步数仍无法完成的情况？10. 你的 Agent 目前接入了哪些工具？11. 你是如何约定并约束大模型进行工具调用的？12. 你的项目推流是否使用 SSE？13. 你的 Agent 编排流程中有没有做 Plan 阶段？14. 从协议层面，介绍 SSE、WebSocket 与 HTTP 的区别和关联？15. 项目为什么限制每个用户只能上传单个文件？16. 项目的图像识别如何实现的，为什么不用多模态大模型，而选择传统的识别模型？17. 你的项目中用到了哪些大语言模型？18. 请介绍 Go 语言的并发和其他语言并发的区别？19. Goroutine 是什么，请介绍一下它的核心原理？20. 你对锁的理解是什么，锁是解决什么问题的？21. 日常开发中用哪种锁更多，还了解哪些后台开发常用的锁？22. 多机器、多进程场景下会涉及到哪些锁，是否了解分布式锁？23. 你对 MCP、Function Call、A2A 分别是怎么理解的？24. 你的项目接入了哪些 MCP 服务？有没有本地手写过 MCP 服务？25. 你日常开发会借助哪些 AI 工具？26. 使用这些工具的心得以及是否有写过相关的 command/skill？27. Claude Code 的实现原理？28. 是否了解OpenClaw以及了解它的实现原理？

LambertCla...：Claude Code实现原理都来了，难道是预测到了这波源码泄露

查看26道真题和解析

点赞评论收藏

分享

04-14 08:50

广西大学算法工程师

快手大模型算法开发一面

1. 自我介绍2. 项目拷打3. Reward Model 在对齐训练里扮演什么角色Reward Model 本质上是在学一个“人类更偏好什么”的可微近似函数。SFT 学的是“像人那样答”，RM 学的是“人更喜欢哪种答法”。它并不直接生成答案，而是给候选答案打分，把人类偏好从离散排序信号压进一个标量目标里，后续无论是 PPO 还是其他策略优化方法，核心都要依赖这个分数去推动模型往偏好更强的方向移动。RM 最大的价值不是替代人工，而是把人工偏好从逐条监督扩展成可批量泛化的训练信号。真正难的地方在于它很容易学到表面模式，比如更长、更像模板、更会说套话的答案可能被错判成更优，所以 RM 训练的上限很...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

35446次浏览 441人参与

# 想从事Agent应该学习哪些技术？ #

8672次浏览 295人参与

# 有哪些公司在面试时考察AICoding？ #

19647次浏览 350人参与

# 你的第一家实习公司是什么档次？ #

70325次浏览 335人参与

# HR面都在聊什么？ #

13920次浏览 164人参与

# 大学生该如何认清当下的就业环境？ #

162547次浏览 889人参与

# 26届春招投递记录 #

3656次浏览 42人参与

# 从投递到OC，你用了多久 #

24077次浏览 241人参与

# 什么人最适合大厂？ #

12902次浏览 134人参与

# 哪些公司面试还在问八股？ #

14298次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23305次浏览 285人参与

# 我的求职进度条 #

1117806次浏览 8063人参与

# 如何快速融入团队？ #

50128次浏览 306人参与

# 校招生月薪1W算什么水平 #

143454次浏览 493人参与

# 你觉得什么岗位会被AI替代 #

57289次浏览 371人参与

# 多益网络工作体验 #

68595次浏览 310人参与

# 薪资爆料 #

412715次浏览 2209人参与

# 美团开奖 #

407837次浏览 1805人参与

# 运营来爆料 #

98846次浏览 508人参与

# 你觉得机械有必要实习吗 #

83702次浏览 529人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务