算法工程师精选面经合集
11家公司
42篇面经
最新 热门
昨天 17:20
门头沟学院 Java
minimax大模型agent一面好难
1.Transformer 中 Attention 的本质是什么?从数学角度解释一下。2.了解Agent吗?把RAG做成Agent有什么好处3. 在 Agent 多轮对话任务中,Attention 的局限性体现在哪些方面?4.介绍 一下SFT 的核心流程以及数据集的构建策略是怎么样的。5. SFT 之后常见的 Post-Training(如 RLHF)还有哪些?它们之间的目的有何区别?5.什么是 RAG?它是怎么提升生成质量的?标准RAG有什么问题与传统“检索 + 模型生成”的流程有何不同?6.如何评估一个RAG系统是否真正 work?有哪些具体的指标或框架?7.PPO和DPO 在大模型对齐中的主要区别是什么?DPO 训练通常有哪些注意事项?8.是否了解或使用过 GRPO 算法?9. 项目里的 Modular Agent 是如何实现Multi-step Planning的?10. 项目中工具调用的调度策略是如何设计的?是否有异常 fallback策略?11. Agent评估体系包括哪些维度?如何衡量规划能力 vs 幻觉率?12.在微调Qwen 模型时,选择的训练阶段和 Loss 函数是如何决定的?13. Prompt 自动推荐模块用了哪些优化策略?有没有尝试过 Prompt 压缩或 Embedding 表示的方式?14. 场景题: 假如一个 Agent 推理链路包含 3 个工具 + 高频请求,导致系统整体延迟较高,你会如何进行工程优化?15. 说一下LoRA的原理;LoRA完推理的时候要挂着Adaptor吗?16手撕代码:torch写SFT的loss计算代码(注意shift right
查看17道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/7a5c0b3c375c45c2a3f35e5015139116
昨天 17:00
门头沟学院 Java
字节agent开发实习一面凉经
深入拷打项目,答出来8成左右。感觉面试官已经想放水了,奈何楼主太菜,代码题没完全撕出来,继续沉淀1. 为什么选择 Spring AI 框架?2. Spring AI 框架的主要优势是什么?3. 如何设计多模型支持架构?4. 多租户环境下模型切换是否支持热更新?切换是否相互独立?5. Agent 的记忆、工具调用、知识库检索等关键组件是如何实现的?6. 系统中的 Agent 包含哪些具体状态?7. 后端 Agent 是否支持多租户同时调用?8. Session 和 User ID 是如何绑定的?9. Agent 工具调用的完整业务流程是怎样的?10. 长期记忆和短期记忆在设计上有什么区别?本质上有什么区别?11. SSE 在前后端是如何交互的?12. 后端以什么数据格式推送流式信息?13. Agent 发生“工具调用”时,SSE 推送的事件结构中通常包含哪些字段?14. MCP的交互流程是怎样的?15. Agent 如何与 MCP Server 连接通信?16. RAG 的主要模式和主要工作流程是怎样的?17. Agent 一般在什么阶段去查询向量知识库?通过什么方式去查询?18. 查询知识库的工具函数,其标准输入和输出是什么?19. Go 语言的 GMP 调度模型是怎样的?20. GMP 模型中的 Machine (M) 代表什么?21. Processor (P) 上的本地队列长度通常是多少?22. 系统如何实现图像识别等多模态功能?23. 为什么不直接使用多模态大模型?24. 在没有前端界面的情况下,本地图片是如何传到后端并进行识别的?25. 对其他主流 AI 框架(如 LangChain)有了解吗?26. 你最熟悉的主力编程语言是什么?27. 手撕 :两两交换链表中的节点
查看27道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/69b9cd21f1244d3cb19499f249228b50/feed/main/detail/28b794ef7e324ed2b3dc18b3940806e8
昨天 16:25
门头沟学院 Java
快手AI Agent开发一面(已过)
面试1h左右RAG 架构与检索流程1、为什么引入父子索引?2、为什么在检索阶段引入BM25?(追问)BM25和向量检索是怎样组合的?比例是如何设置的?(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?(追问)检索阶段有没有做rerank?使用的是什 么方式?Rerank 与检索结果处理1、rerank后一般返回几个块?(追问)为什么选择这个数量?有没有做过验证?2、rerank后的topK截断是怎么做的?(追问)为什么是这个值?有没有尝试过其他策略?(追问)如果上下文长度不够或过长,你是怎么处理的?上下文工程与记忆机制1、讲一下上下文工程是怎么设计的。(追问)上下文拼接的结构是怎样的?(追问)如何避免上下文过长导致模型性能下降?2、记忆机制是怎么做的?(追问)短期记忆和长期记忆是如何区分和存储 的?(追问)记忆更新策略是什么?Agent设计与工具调用1、Function Calling 是怎么设计的?2、Agent的任务规划是怎么做的?(追问)规划是由模型完成还是通过规则实现?(追问)多工具调用时如何决定调用顺序?(追问)如果工具调用失败如何处理?安全与防护机制1、Prompt注入攻击如何防御?(追问)有没有做输入过滤或规则校验?2、工具调用的安全控制是怎么实现的?(追问)如何限制模型调用敏感接口?(追问)是否有权限控制或白名单机制?限流与系统设计1、讲一下分布式令牌桶限流。2、漏桶算法是什么?3、滑动窗口算法是怎么实现的?(追问)如果使用滑动窗口,结构体中会包含哪些字段?4、滑动窗口和令牌桶相比有什么区别?(追问)如果用Redis实现限流,会使用什么数据结构?基础算法与数据结构1、布隆过滤器讲一下。(追问)会出现什么问题?(追问)如何控制误判率?数据库与索引1、数据库索引失效的情况有哪些?2、like查询会不会导致索引失效?(追问)哪些写法会导致索引无法命中?RAG 评测与数据集1、RAG系统如何评测?2、有哪些评测维度?(追问)常见的指标有哪些?3、评测数据集一般包括哪些内容?(追问)如何构建高质量评测数据?RAG 优化与效果提升1、如果要提升相关度,你会怎么做?2、如果要优化回答效果,有哪些思路?(追问)是优化检索阶段还是生成阶段?(追问)如何验证优化是否有效?系统设计题1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?(追问)如果数据规模扩大到百万级怎么处理?(追问)如何保证计算效率和稳定性?RAG 性能优化1、RAG的性能如何提升?(追问)是从检索、模型还是系统架构优化?(追问)有没有做缓存或并行优化?上下文优化1、当前的上下文是如何处理的?(追问)有哪些优化思路?(追问)如何减少无关上下文对模型的干扰?
Agent面试会问什么?
点赞 评论 收藏
分享
/feed/main/detail/7ce89f19368b46da853c718f2ae2f53c/feed/main/detail/37e847fa267b4c3898b38e2952b5286e
联想AI agent产品一面(已过)
你觉得之前学的专业对切入新方向(跨到 AI agent 项目)有什么帮助?跨专业、跨方向对你来讲哪些是助力(good thing),哪些是阻力(bad thing)?你之前在做 AI 智能导购时,有没有因对技术(如 NLP 技术、大模型技术)了解不足而影响项目的情况?发现自己在技术接口等方面的不足后,后期做了哪些工作去弥补这些可能影响做产品经理的问题?在 AI 智能导购项目中,哪些工作让你觉得最骄傲、做得最好?垂类的 AI 产品你了解哪些?在生活中用过哪些垂类或通用领域的 AI 工具 / 智能体帮助办公或学习?做 AI 产品调研时,一般用什么方式?有哪些渠道?对于海外产品如何做调研?做竞品分析通常怎么做?之前做产品时是否做过用户调查或用户动力洞察?如何确定目标客户群?你有自己的交互设计作品集吗?AI、大模型、ChatGPT、NLP 这几个概念是什么?它们之间的区别是什么?对于国内或国外的 3C 数码产品用户,他们在购买过程中有什么痛点?我们能帮他们解决这些问题吗?如果你自己购买大几千元或万元及以上的产品,会直接购买还是会有查询等操作?假如要做二手相机的 AI agent 产品,让用户相信你且体验好,你有什么设计想法?作为产品经理,怎么让用户觉得你的平台 / APP 是靠谱的、值得相信的?在你提到的购买流程的每一步中,如何让用户去相信?京东等平台上某一商品可能有上万条评论,有好有坏,站在产品经理角度,如何让用户进来后能一目了然地捕捉到重要信息,无需看完所有评论?你刚刚提到博主可以帮你增加对产品的信任度,博主的专业性对你的信任度影响大吗?是否会因为觉得博主讲得专业而更信任?假如在卖相机的平台里增加笔记本品类,从哪些角度保障试用的准确性和真实性?从交互上,增加哪些维度能让用户更青睐你的产品?设计 3C agent 产品(卖笔记本或二手相机)时,除了基础的数据和知识建设、三方评价外,从设计层面还能做哪些优化让用户更加认可或信任?把 AI agent 比作人或助手,怎么让用户一见钟情于你的 APP 或其能力,更容易记住?假如你做的 3C 产品 AI agent 要与众多电商平台或品牌官网的 APP 竞争,从零开始推广,怎么提高竞争力,让大家知道、使用甚至形成粘性?若面向海外(如北美地区)推广二手相机或 3C 产品的 AI agent 产品,会做哪些变化?现在哪些技术会降低用户对 3C 类 AI 产品的使用体验?作为产品经理,会想什么办法弥补这些技术缺陷?反问:业务 / 团队氛围相关问题
查看21道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/8fd2c5f946ad4d61b7544f29d0b14402/feed/main/detail/9bc47e9990824fb8bde91cd40869c164/feed/main/detail/7af26b7a99e54b29af671ac334b445b5
昨天 19:56
已编辑
University of Pennsylvania Java
找工记录04 - 4.8 阿里AI应用研发笔试
1. 单选题,多选题:大部分在考Prompt Engineering,比如通过输出分析原因啥的。其余考了Transformer、SQL和计算机网络2. 代码题:第一题:给一组密码字符串,选择同一个位置统一改成相同字符,求操作后的最少密码种类数。思路是求解删掉一列后,有多少种不同字符串,用一个for loop就能解决第二题:找环形字符里包含k个‘1’的字符串最短长度。思路是把字符copy一遍 + 滑动窗口,比较简单第三题:求一个字符串中有多少子序列是不平衡数(数字位中奇数不等于偶数)。这题没a出来,当时的想法是先遍历字符串,奇数为-1,偶数为1,那么平衡数就是所有位置的值相加为0,最后不平衡数 = 总子序列 - 平衡数。结果没注意子序列不能包括前导零,而且涉及到了不熟悉的取模操作,改了两次测试结果都没跑出来,直接放弃去写prompt题3. Prompt题:预留10分钟来做这道题,洋洋洒洒写了一大篇Prompt结果连测试结果都是0%的正确,完全不知道怎么回事,最后也没时间改了,感觉阿里这个模型笨笨的。建议这题能留20分钟写,因为题干没办法复制粘贴,全部都得手动输入,当时梳理信息 + 整理输入我就快花了8-9分钟。总体来说感觉难度适中,没有后端笔试那么难,对Prompt、大模型考察更多,有些选择题我甚至连选项都没看懂。另外,在笔试之前阿里面试官就加了我微信,但是一直没回消息这啥情况,有朋友知道吗update:第二天晚上收到了一面电话
查看7道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/9a8093d5352c4bf5821d5f38bf56f17e/discuss/871774510138023936
昨天 15:17
已编辑
北京航空航天大学 Java
字节跳动面过了?没面过!
🎯 面试题:大模型热更新与流量调度平台【整理真题+解析+押题预测】公司:字节跳动年份:2026月份:1月面试轮次:三面岗位:AI平台研发工程师难度:⭐⭐⭐⭐⭐真题:“假设字节的推荐系统需要从ERNIE 3.0模型灰度升级到ERNIE 4.0。设计一个支持大模型热更新的流量调度平台。要求实现:1)可实时调整新旧模型的流量比例(如90%流量走V3,10%走V4);2)平滑无损切换,不能因更新导致服务中断;3)支持基于用户ID、设备ID等维度的精细化分流。给出架构设计、核心代码,并说明如何保证数据一致性(比如同一个用户的请求必须路由到同一个模型版本)。”💡 解析:这是典型的三面架构题,直接考察你设计复杂系统的能力。核心是流量治理和状态管理,将业务需求(模型迭代)转化为稳定、可控的技术方案。设计思路: 分层架构: 配置中心:存储流量配比规则(如 {“v3”: 0.9, “v4”: 0.1}),支持动态推送。 流量路由器:部署在网关或SDK中,根据规则和请求特征(用户ID哈希)决定流量走向。 模型服务池:新旧模型作为独立服务部署,对外暴露统一接口,但版本号不同。 数据收集器:实时收集各版本模型的性能指标(成功率、延迟),用于后续决策。 关键实现: 一致性哈希:确保同一用户(通过userId计算哈希)的请求在流量比例不变时,始终命中同一模型,保证体验连贯。 动态配置监听:使用ZooKeeper、Nacos或Apollo(字节内部常用),实现秒级规则生效。 无损切换:先扩容新模型服务,再调大流量,最后缩容旧服务。过程中监控核心指标,异常则快速回滚。应用业务场景: 这就是抖音推荐算法模型升级的标准流程。每天都有模型迭代,不可能停机发布。必须通过灰度平台,先让小部分用户体验新模型,监控CTR(点击率)、停留时长等业务指标,效果达标再全量,效果不好则回退。核心考点: 微服务流量治理架构设计 一致性哈希算法原理与实践 配置中心与动态推送机制 高可用发布(金丝雀发布/灰度发布)策略 监控与快速回滚能力实践(避坑指南): 流量“倾斜”:简单的随机分流可能导致小流量模型得不到有效样本。需确保分流均匀,且覆盖各类用户群体。 状态缓存:如果模型升级涉及特征存储格式变化,需注意缓存兼容性与清理策略。 回滚预案:必须自动化。当新模型故障率超过阈值,能自动将流量切回旧模型。🚨 趋势押题预测预测名称:多模型混排与智能流量调配系统押题题目:“设计一个多模型在线混排系统。一个请求可同时被多个模型(如ERNIE 4.0、ERNIE 3.5、低成本小模型)处理,系统需根据实时性能(延迟、成本)、业务指标(点击率)以及用户标签,智能决策最终返回哪个模型的结果,并动态调整各模型的调用比例。阐述架构与核心算法。”押题依据:频率雷达:在三面/终面中,“模型发布”与“流量策略”是关联性极强的组合考点,年出现22次。是考察架构师全局视野的经典题。趋势风向:字节内部已不满足于简单的A/B测试,追求更细粒度、更动态、更经济的模型调度。利用小模型承接简单请求以节约成本,是明确的技术方向。信息来源:参考字节跳动机器学习平台决策、部分业务线分享的“多模型择优”技术方案。押题逻辑理由:从“静态灰度”升级到“动态智能调度”,是技术演进的必然。三面问题会挑战你设计的上限。面试官期望看到的不只是实现功能,而是如何通过系统化设计,实现业务效果(用户体验、成本)的最优化。这要求你对算法、系统、业务均有深刻理解。核心考点:在线决策系统、多目标优化(效果/成本/速度)、实时特征计算、自适应算法。适配岗位:AI平台架构师、推荐系统高级工程师。押中概率:75%​ (高阶架构题,区分顶级候选人的利器)【代码示例】智能流量路由器核心片段@Componentpublic class IntelligentModelRouter {@Autowiredprivate ModelPerformanceMonitor monitor;@Autowiredprivate DynamicConfig config;// 核心路由方法public String route(RequestContext ctx) {List<ModelCandidate> candidates = getAvailableModels(ctx);// 1. 过滤:剔除当前不可用或性能不达标的模型candidates = filterByHealth(candidates);// 2. 打分:基于多维度为每个候选模型打分candidates.forEach(c -> c.setScore(calculateScore(c, ctx)));// 3. 选择:根据打分结果和策略(如epsilon-greedy)选择模型ModelCandidate selected = selectionStrategy.select(candidates);// 4. 记录:用于后续学习与策略调整recordRoutingDecision(ctx, selected);return invokeModel(selected, ctx);}private double calculateScore(ModelCandidate candidate, RequestContext ctx) {// 评分公式示例:Score = w1*效果预测 + w2*性能得分 + w3*成本系数double effectScore = predictModelEffect(candidate.getModelId(), ctx.getUserFeatures());double perfScore = normalize(monitor.getP99Latency(candidate.getModelId()));double costScore = 1.0 / candidate.getInferenceCost(); // 成本越低,得分越高double bias = config.getTrafficBias(candidate.getModelId()); // 人工偏向,用于冷启动return config.getWeightEffect() * effectScore+ config.getWeightPerf() * perfScore+ config.getWeightCost() * costScore+ bias;}}最后,我想说:字节跳动寻找的,从来不是“行走的八股文答案库”,而是能真正用技术解决复杂业务问题、有好奇心、有成长性的工程师。希望这份指南,能成为你技术长征中的一张实用地图。🔥评论区:接好运,祝你顺利上岸!!!!~~~~
查看2道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/44df96b797fd4c21a88e2b0b9e485591/feed/main/detail/b43b97d74fb64653a4660591eb843d47/feed/main/detail/0b4a135819904929b694e26ec5aea81a/discuss/871771708112265216
昨天 14:27
门头沟学院 Java
字节Agent开发一面90min凉经
抖音基础架构团队1.自我介绍问实习:2.提示词模板是怎么构建的?3.单Agent还是多Agent的?子Agent任务是什么?4.分支覆盖率是怎么统计的?原理有没有了解过?代码插桩具体是怎么实现的?5.对于代码解析有没有前置分析?有效性判断怎么实现的?未来让你来优化这些指标你会怎么设计?6.有没有思考过哪些代码会让模型生成的代码准确度和覆盖率降低?这些用AST和LSP都生成不了单测的代码如何过滤?7.mock是怎么实现的?问项目:8.多维度的查询改写是什么?改写的时候遇到需要用户参与补充信息时怎么设计?技术上怎么实现?9.并行化意图识别是什么?为什么要并行化?如何实现的?10.讲一下项目里召回的流程11.对于上下文工程有什么经验吗?有没有做过to do list?为什么这样会让模型更聚焦,怎么实现的?12.skills的原理有没有了解过?怎么实现的?问八股:13.LLM的底层原理有没有了解?输入给模型的是什么?14.self attention怎么实现的有了解吗?为什么要分成QKV,怎么计算的?同一个token向量是一样的吗?15.python有没有多线程?为什么要有GIL,有没有了解过?多线程的锁都有什么?lock和Rlock有什么区别?16.信号量的底层是怎么实现的?17.cpp编译链接流程有没有了解?编译分哪些步骤?手撕:18.岛屿最大面积19.反问
查看18道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/91c5394e57c14927841d7a86bfe427c2/feed/main/detail/156254d412434209a16e9e71b7180905
淘天aiagent一面
好难,分享面经攒人品。· 在Agent知识闭环中,如何设计决定哪些信息进入向量数据库(长期记忆)、哪些进入上下文窗口(短期记忆)、哪些直接转化为模型权重的元记忆?· 当对话轮数较多且上下文窗口严重不足时,如何在不丢失初始Attention Sink的前提下保持生成的连贯性?· 详细讲讲你设计的Agent是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?· MCP与传统Agent Skills的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?· 在电商或导购场景下,用户的请求往往高度模糊,Agent如何精准理解这种需求?· 如何设计一套“主动澄清”决策逻辑?什么情况下Agent应该反问用户,什么情况下应该结合历史画像强行推断?· 针对包含3个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?· 如何衡量Agent的Planning能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。· 在多Agent协作系统中,不同Agent之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?· Token过长导致的Attention稀释现象为什么会导致Agent的指令遵循能力下降?· 摘要总结往往会丢失关键细节,在长文本Agent中一般怎么处理这一块?· 当候选工具超过100个时,如何设计路由策略?怎么解决检索过程中的召回偏差?· 在Agent多轮对话任务中,标准Attention机制的平方复杂度在工程落地主要引发了哪些问题?· 目前有哪些机制可以缓解模型在上下文对话里的“信息遗忘”现象?当对话轮数很多、上下文窗口不够时,有哪些处理策略?· 为什么在复杂的Agent闭环场景中,仅靠RAG无法彻底解决幻觉问题?模型幻觉在电商这种强事实性场景里怎么治理?这个问题很现实。比如用户咨询某款运动鞋:“这款鞋参加今晚的‘满300减50’活动吗?”如果模型产生幻觉,随口答复,而实际该品牌属于不参加活动的黑名单商家。一旦用户下单后发现没减钱,就会产生大规模的退货和客诉。· 面对模型在Agent执行过程中出现的循环调用或陷入思维死循环问题,有哪些解决方法?· GraphRAG在处理Agent复杂关联查询时的优势在哪里?· 任务执行远大于单次Token限制时,如何设计以支持断点继续生成?· 设计一个智能导购助手Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。
查看19道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/a00f89eb057d4476bd67f3b24679cdb8/feed/main/detail/9982e3162a5e4c49b3f13bda8a53533b/feed/main/detail/497e14617f01453db84dfbc264e5751e/discuss/871729066020257792
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务