淘天aiagent一面

好难,分享面经攒人品。
· 在Agent知识闭环中,如何设计决定哪些信息进入向量数据库(长期记忆)、哪些进入上下文窗口(短期记忆)、哪些直接转化为模型权重的元记忆?
· 当对话轮数较多且上下文窗口严重不足时,如何在不丢失初始Attention Sink的前提下保持生成的连贯性?
· 详细讲讲你设计的Agent是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?
· MCP与传统Agent Skills的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?
· 在电商或导购场景下,用户的请求往往高度模糊,Agent如何精准理解这种需求?
· 如何设计一套“主动澄清”决策逻辑?什么情况下Agent应该反问用户,什么情况下应该结合历史画像强行推断?
· 针对包含3个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?
· 如何衡量Agent的Planning能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。
· 在多Agent协作系统中,不同Agent之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?
· Token过长导致的Attention稀释现象为什么会导致Agent的指令遵循能力下降?
· 摘要总结往往会丢失关键细节,在长文本Agent中一般怎么处理这一块?
· 当候选工具超过100个时,如何设计路由策略?怎么解决检索过程中的召回偏差?
· 在Agent多轮对话任务中,标准Attention机制的平方复杂度在工程落地主要引发了哪些问题?
· 目前有哪些机制可以缓解模型在上下文对话里的“信息遗忘”现象?当对话轮数很多、上下文窗口不够时,有哪些处理策略?
· 为什么在复杂的Agent闭环场景中,仅靠RAG无法彻底解决幻觉问题?模型幻觉在电商这种强事实性场景里怎么治理?
这个问题很现实。比如用户咨询某款运动鞋:“这款鞋参加今晚的‘满300减50’活动吗?”如果模型产生幻觉,随口答复,而实际该品牌属于不参加活动的黑名单商家。一旦用户下单后发现没减钱,就会产生大规模的退货和客诉。
· 面对模型在Agent执行过程中出现的循环调用或陷入思维死循环问题,有哪些解决方法?
· GraphRAG在处理Agent复杂关联查询时的优势在哪里?
· 任务执行远大于单次Token限制时,如何设计以支持断点继续生成?
· 设计一个智能导购助手Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。 #Agent面试会问什么?#
全部评论
这么难吗
1 回复 分享
发布于 04-11 00:46 四川
抄袭面筋嘛 有点意思
点赞 回复 分享
发布于 04-14 22:18 广东
这篇面经好熟
点赞 回复 分享
发布于 04-11 14:54 广东
有答案吗
点赞 回复 分享
发布于 04-09 13:35 北京
难怪我过不了
点赞 回复 分享
发布于 04-09 13:22 湖南

相关推荐

04-04 11:16
已编辑
中山大学 算法工程师
一.实习 拷打28min二.项目12.1 现在有了Claude Code,为什么还要去重复的做一个类似的项目呢?2.2 这个项目和Claude Code相比,核心差异是什么?有什么比他做的好,什么不如他?2.3 分层上下文管理,每一层管的是什么?2.4 摘要生成器使用什么模型做的?这个摘要质量要如何保证?2.5 有没有尝试一下关于subagent的探索?启动多个agent的作用是什么?2.6 主agent和子agent的通信是怎么实现的?2.7 有没有遇到过agent陷入死循环的情况?有什么解决方案?三.项目23.1 GRPO和PPO的区别?3.2 KL散度,具体是怎么加入的?这个值太大或者太小有什么问题?3.3 Qlora的rank怎么设置的?3.4 训练参数是怎么选的?有没有调参测试?3.5 lora和qlora的区别是什么?3.6 量化之后对训练的效果影响是怎么样的?3.7 梯度检查点的原理。它对训练速度大概减缓多少?四.随机提问4.1 平时用过哪些Ai agent的工具?4.2 你觉得Ai工具,最大的帮助场景是什么?4.3 有没有遇到过Ai应用或者工具无法解决的场景?4.4 平时写的代码或者实习写的代码有多少是Ai生成的?4.5 openclaw有没有实际使用过?有没有做相关的了解?比如它的架构设计上的优势是什么?4.6 你觉得类似于openclaw或者Claude code,它现在还有哪些地方是可以改进的?4.7 Claude code源码泄露,有没有去了解它,有什么比较创新的东西?4.8 从开发者的角度,做agent最难的部分是什么?4.9 自己做agent的时候,踩过最大的坑是什么?4.10 一个好的prompt和一个差的prompt的区别?4.11 除了Qwen3VL,还有没有使用过其他的多模态大模型?4.12 有没有了解一些端侧部署的模型?五.python八股5.1 python中的深拷贝和浅拷贝的区别?5.2 python中的修饰器知道吗?5.3 python中的字典的底层原理?5.4 死锁的条件是什么?5.5 哈希表的原理?六.Code无code
点赞 评论 收藏
分享
04-09 16:25
门头沟学院 Java
面试1h左右RAG 架构与检索流程1、为什么引入父子索引?2、为什么在检索阶段引入BM25?(追问)BM25和向量检索是怎样组合的?比例是如何设置的?(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?(追问)检索阶段有没有做rerank?使用的是什 么方式?Rerank 与检索结果处理1、rerank后一般返回几个块?(追问)为什么选择这个数量?有没有做过验证?2、rerank后的topK截断是怎么做的?(追问)为什么是这个值?有没有尝试过其他策略?(追问)如果上下文长度不够或过长,你是怎么处理的?上下文工程与记忆机制1、讲一下上下文工程是怎么设计的。(追问)上下文拼接的结构是怎样的?(追问)如何避免上下文过长导致模型性能下降?2、记忆机制是怎么做的?(追问)短期记忆和长期记忆是如何区分和存储 的?(追问)记忆更新策略是什么?Agent设计与工具调用1、Function Calling 是怎么设计的?2、Agent的任务规划是怎么做的?(追问)规划是由模型完成还是通过规则实现?(追问)多工具调用时如何决定调用顺序?(追问)如果工具调用失败如何处理?安全与防护机制1、Prompt注入攻击如何防御?(追问)有没有做输入过滤或规则校验?2、工具调用的安全控制是怎么实现的?(追问)如何限制模型调用敏感接口?(追问)是否有权限控制或白名单机制?限流与系统设计1、讲一下分布式令牌桶限流。2、漏桶算法是什么?3、滑动窗口算法是怎么实现的?(追问)如果使用滑动窗口,结构体中会包含哪些字段?4、滑动窗口和令牌桶相比有什么区别?(追问)如果用Redis实现限流,会使用什么数据结构?基础算法与数据结构1、布隆过滤器讲一下。(追问)会出现什么问题?(追问)如何控制误判率?数据库与索引1、数据库索引失效的情况有哪些?2、like查询会不会导致索引失效?(追问)哪些写法会导致索引无法命中?RAG 评测与数据集1、RAG系统如何评测?2、有哪些评测维度?(追问)常见的指标有哪些?3、评测数据集一般包括哪些内容?(追问)如何构建高质量评测数据?RAG 优化与效果提升1、如果要提升相关度,你会怎么做?2、如果要优化回答效果,有哪些思路?(追问)是优化检索阶段还是生成阶段?(追问)如何验证优化是否有效?系统设计题1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?(追问)如果数据规模扩大到百万级怎么处理?(追问)如何保证计算效率和稳定性?RAG 性能优化1、RAG的性能如何提升?(追问)是从检索、模型还是系统架构优化?(追问)有没有做缓存或并行优化?上下文优化1、当前的上下文是如何处理的?(追问)有哪些优化思路?(追问)如何减少无关上下文对模型的干扰?
Agent面试会问什么?
点赞 评论 收藏
分享
评论
12
87
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务