算法工程师精选面经合集
11家公司
41篇面经
最新 热门
/feed/main/detail/b970f12e7ac64bafa42e331c163f7047/feed/main/detail/b6accd9ab7224512a9523cb5c0e13a52/feed/main/detail/c346de3c1bf844a69fd827f4bdebe3a8/feed/main/detail/c17e8837a68845eea09bbce0d0fca999/discuss/873157031295737856/feed/main/detail/a5b0faf7f2eb483c9cc016067b2ba09e/feed/main/detail/df255e5bb16846a180108584a54c247a/discuss/873126940675170304/feed/main/detail/341b5464c6404366a1a5c6a70c441bee/feed/main/detail/1252edf666354da6be3709b26bcbf967/discuss/873126932777295872/feed/main/detail/f0659cccdf4445ab92513adbe2a713c9/feed/main/detail/c37da9fb5e5d4bcbbab6e33654877253/feed/main/detail/c54dbce0fb20413694560a8679968daf
蚂蚁实习 AI agent算法二面 1h
攒人品中,祝大家都能拿到满意的Offer!1.项目拷打2. 实习拷打3. 你们选用的训练方法是什么?训练数据具体是怎么构造的?4. 这里的训练过程,我理解是前面有一段医学语料的预训练,然后再加一段对齐过程,是这样吗?5. 关于 SFT 阶段,数据具体是怎么生成的?6. SFT 之后,后面的 DPO 过程又是如何开展的?7. DPO 需要 Chosen 和 Rejected 至少两组对比数据,这两组数据你们是怎么得到的?8. 我们现在这边可能对于医疗业务关系比较远,问一下更加基础的知识。既然谈到 DPO,谈一下 DPO 以及后续其他偏好学习算法的区别,以及各自的优劣。9. 那么 GRPO 算法呢?10. DPO 算法有哪些缺点?11. 谈谈强化学习中 On-policy 和 Off-policy 的区别,你是怎么理解的?12. 看你不仅做训练,还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗?13. 当时是在哪个项目里面参与 Infra 工作的14. 你刚才提到了 Megatron,你们试过 PyTorch 原生的 FSDP 吗?15. 既然试过 FSDP,为什么最终还是选用了 Megatron?,你们当时的选型考量是什么?16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别,FSDP 实现了 ZeRO 的哪几个阶段?ZeRO-1, 2 还是 3?17. 探讨一个现实的业务问题:我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节,将客户请求分发到不同的子 Agent,由于子 Agent 功能实现完全不同,不能混在一起,所以路由非常关键,一旦路由错误就无法满意回答。另外,作为全链路的必经点,路由必须足够快。我们考虑在最前端用一个相对较小(如 7B 或 13B)的模型,通过后训练使其掌握特定领域知识,实现低延迟的路由。如果让你做这个模型,你会怎么去做?
查看15道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/bb104bff702a41f78edbda889ab5bb02/feed/main/detail/bdc294011ece4331a9ab3c05908edf29
傅利叶机器人具身智能一面面经分享
发一下问题给大家参考,攒攒人品!1. 基础架构与熟悉度• 你对 UniVLA 这个架构熟悉吗?• UniVLA 的 late action model / 潜在动作模型 是怎么搭建的?(VQ-VAE 部分的逻辑)• 你们这个架构非常大,你在其中承担哪些工作?2. 训练范式与数据设计• 你们的 subtask 是怎么标注时间段的?(开始/终止时间标注规则)• 你们任务编码的 prompt 是给的拆解后的 prompt 吗?是怎么给的?• 你们自己给 action 打了标签吗?• 你们 SFT 调的是 7B 的 perspective 模型吗?两个 SFT 都调的是这个 7B 模型?• 你们的数据量跟模型参数分别是多大?latent action 的参数量是不是只有 1–2B?3. 技术细节与优化• Pi 0.5 有看过吗?它有什么改进?• 看过 real time chunking(RTC)吗?• 复现的 py 结果有慢跟抖动,有没有考虑过后处理的方式?• 提速有什么方式吗?• 桌面高度是一定的吗?• 对深度感知要求高的任务(scanning/inserting),是不是可以加额外的措施?有没有考虑过?• 你们的训练计算资源是什么情况?二、算法与技术路线类1. 算法题• 输入整数数组和整数 limit,找到最长的连续子数组,使得子数组中任意两个元素的绝对差不超过 limit,返回子数组长度例:[8,2,4,7,2,4,7,8,2,4,7,8,2,4,7],limit=4 → 输出 22. 技术路线与选型• 目前视频预测模型为结构模型的方案、world model 相关工作怎么看?• 你们的技术路线,对机器人全身控制会做类似 UniVLA / VLA 的工作吗?
查看18道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/37af3ac1986b438c81cd26ab90a792a8
今天 01:52
门头沟学院 C++
Agent面试最容易被问挂的3个问题
我最近把AI Agent面经从0到1全部梳了一遍(含字节、阿里、腾讯真实面试),发现面试官真正想听的根本不是定义。很多人(包括苯人一开始)以为Agent面试就是背ReAct、背Tool Calling、背LangChain,结果一开口就被面试官打断:“这些我都知道,你说说你的设计思路。”我问懵过两次后才醒悟,Agent面试不是八股,是体系考察。下面这3个问题,几乎是每场面经中必问,🐮友们看看自己会不会踩坑。1.如果你做一个Agent,遇到工具调用失败或者LLM幻觉怎么办?我当时直接答“加retry”或“加human in the loop”,秒挂后面问claude,面试官想听的是完整容错体系:- 怎么判断是工具错还是LLM幻觉?- 用另一个LLM做fact-check / self-consistency- 降级到弱Agent / 规则引擎 / 人工兜底- 失败后状态怎么回滚?- 生产环境怎么监控Agent健康度2. Agent的Memory你怎么设计?大多数人(和我一样会说短期用ConversationBuffer,长期用向量数据库,直接寄。面试官想听的是分层记忆体系 + 读写策略:- Working Memory(当前任务上下文)- Episodic Memory(历史任务轨迹)- Semantic Memory(领域知识)- 什么时候用向量检索?什么时候用Graph?- 遗忘机制怎么做?(重要性评分 + 定期压缩)- 多Agent共享Memory时的读写锁和一致性问题3.单Agent和Multi-Agent你什么时候选哪个?怎么协作?”如果直接说任务复杂就用Multi基本凉。真正要讲的是决策框架:- 任务可分解性、通信成本、调试难度、单点故障风险- 协作模式(Hierarchical / Decentralized / Mixture-of-Agents)- 协调机制(Shared State / Message Queue / Supervisor)- 实际项目里Multi-Agent带来的收益和踩过的坑
查看3道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/b45e0fb85eeb4717a78ad53563b94f1b/feed/main/detail/d69f0834b4a6425f91dc39ab6a50ec83/discuss/872969790967603200
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务