快手AI Agent开发一面(已过)

面试1h左右
RAG 架构与检索流程  
1、为什么引入父子索引?  
2、为什么在检索阶段引入BM25?  
(追问)BM25和向量检索是怎样组合的?比例是如何设置的?
(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?  
(追问)检索阶段有没有做rerank?使用的是什 么方式?  

Rerank 与检索结果处理  
1、rerank后一般返回几个块?  
(追问)为什么选择这个数量?有没有做过验证?  
2、rerank后的topK截断是怎么做的?  
(追问)为什么是这个值?有没有尝试过其他策略?  
(追问)如果上下文长度不够或过长,你是怎么处理的?  

上下文工程与记忆机制  
1、讲一下上下文工程是怎么设计的。  
(追问)上下文拼接的结构是怎样的?  
(追问)如何避免上下文过长导致模型性能下降?
2、记忆机制是怎么做的?  
(追问)短期记忆和长期记忆是如何区分和存储 的?  
(追问)记忆更新策略是什么?  

Agent设计与工具调用  
1、Function Calling 是怎么设计的?  
2、Agent的任务规划是怎么做的?  
(追问)规划是由模型完成还是通过规则实现?  
(追问)多工具调用时如何决定调用顺序?  
(追问)如果工具调用失败如何处理?  

安全与防护机制  
1、Prompt注入攻击如何防御?  
(追问)有没有做输入过滤或规则校验?  
2、工具调用的安全控制是怎么实现的?
(追问)如何限制模型调用敏感接口?
(追问)是否有权限控制或白名单机制?  

限流与系统设计  
1、讲一下分布式令牌桶限流。  
2、漏桶算法是什么?  
3、滑动窗口算法是怎么实现的?  
(追问)如果使用滑动窗口,结构体中会包含哪些字段?  
4、滑动窗口和令牌桶相比有什么区别?  
(追问)如果用Redis实现限流,会使用什么数据结构?  

基础算法与数据结构  
1、布隆过滤器讲一下。  
(追问)会出现什么问题?  
(追问)如何控制误判率?  

数据库与索引
1、数据库索引失效的情况有哪些?  
2、like查询会不会导致索引失效?  
(追问)哪些写法会导致索引无法命中?

RAG 评测与数据集  
1、RAG系统如何评测?  
2、有哪些评测维度?  
(追问)常见的指标有哪些?  
3、评测数据集一般包括哪些内容?  
(追问)如何构建高质量评测数据?  

RAG 优化与效果提升  
1、如果要提升相关度,你会怎么做?  
2、如果要优化回答效果,有哪些思路?  
(追问)是优化检索阶段还是生成阶段?  
(追问)如何验证优化是否有效?

系统设计题  
1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?  
(追问)如果数据规模扩大到百万级怎么处理?  
(追问)如何保证计算效率和稳定性?  
RAG 性能优化  
1、RAG的性能如何提升?  
(追问)是从检索、模型还是系统架构优化?  
(追问)有没有做缓存或并行优化?  

上下文优化  
1、当前的上下文是如何处理的?  
(追问)有哪些优化思路?  
(追问)如何减少无关上下文对模型的干扰? #Agent面试会问什么?#
全部评论
请问下agent开发需要具备哪些知识储备呢
点赞 回复 分享
发布于 04-16 14:48 北京
这没有干出手撕来吗?
点赞 回复 分享
发布于 04-13 17:02 湖北
请问什么部门呀
点赞 回复 分享
发布于 04-12 11:28 广东
无手撕嘛
点赞 回复 分享
发布于 04-10 08:30 北京

相关推荐

03-24 01:15
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1* 详细讲讲你设计的 Agent 是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?2*MCP与传统 Agent Skills 的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?3* 在电商或导购场景下,用户的请求往往高度模糊,Agent 怎么来精准理解这种需求?4* 如何设计一套“主动澄清”决策逻辑?在什么情况下 Agent 应该反问用户,什么情况下应该结合历史画像强行推断?5* 针对包含 3 个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?6* 如何衡量 Agent 的 Planning 能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。7* 在多 Agent 协作系统中,不同 Agent 之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?8* Token 过长导致的 Attention 稀释现象为什么会导致 Agent 的指令遵循能力下降?9* 摘要总结往往会丢失关键细节,在长文本 Agent中一般怎么来处理这一块10* 当候选工具超过 100 个时,如何设计路由策略?怎么解决检索过程中的召回偏差?11* 在 Agent 多轮对话任务中,标准 Attention 机制的平方复杂度在工程落地上主要引发了哪些问题?12* 目前有哪些机制可以缓解模型在长上下文对话里的“信息遗忘”现象?当对话论数很多,上下文窗口不够的时候,有哪里处理的策略13* 为什么在复杂的 Agent 闭环场景中,仅靠 RAG 无法彻底解决幻觉问题?14* 面对模型在 Agent 执行过程中出现的循环调用”或陷入思维死循环问题,有哪些解决方式?15* GraphRAG 在处理 Agent 复杂关联查询时的优势在哪里?16* 任务执行远大于单次 Token 限制时,如何设计以支持断点继续生成?17* 设计一个智能导购助手 Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。18* 手撕算法: 给定一个正整数 n(如 23121和一组不重复的数字集合 a(如 \{2,4,9\}),求使用 a 中数字组成的、小于 n 的最大整数。要求考虑贪心回退逻辑,处理所有边界情况。
点赞 评论 收藏
分享
上周组里招人,我面了六个候选人,回来跟同事吃饭的时候聊起一个让我挺感慨的现象。前三个候选人,算法题写得都不错。第一道二分查找,五分钟之内给出解法,边界条件也处理得干净。第二道动态规划,状态转移方程写对了,空间复杂度也优化了一版。我翻他们的简历,力扣刷题量都在300以上。后三个呢,就有点参差不齐了。有的边界条件没处理好,有的直接说这道题没刷过能不能换个思路讲讲。其中有一个女生,我印象特别深——她拿到题之后没有马上写,而是先问我:“面试官,我能先跟你确认一下我对题目的理解吗?”然后她把自己的思路讲了一遍,虽然最后代码写得不是最优解,但整个沟通过程非常顺畅。这个女生的代码不是最优的,但当我问她“如果这里是线上环境,你会怎么设计’的时候,她给我讲了一套完整的方案——异常怎么处理、日志怎么打、怎么平滑发布。她对这是之前在实习的时候踩过的坑。”我在想LeetCode到底在筛选什么?我自己的经历可能有点代表性。我当年校招的时候,也是刷了三百多道题才敢去面试。那时候大家都刷,你不刷就过不了笔试关。后来工作了,前三年基本没再打开过力扣。真正干活的时候,没人让你写反转链表,也没人让你手撕红黑树。更多的是:这个接口为什么慢了、那个服务为什么OOM了、线上数据对不上了得排查一下。所以后来我当面试官,慢慢调整了自己的评判标准。算法题我还会出,但目的变了。我出算法题,不是想看你能不能背出最优解。而是想看你拿到一个陌生问题的时候,是怎么思考的。你会先理清题意吗?你会主动问边界条件吗?你想不出来的时候会怎么办?你写出来的代码,变量命名乱不乱、结构清不清楚?这些才是工作中真正用得到的能力。LeetCode是一个工具,不是目的。它帮你熟悉数据结构和常见算法思路,这没问题。但如果你刷了三百道题,却说不清楚自己的项目解决了什么问题、遇到了什么困难、你是怎么解决的,那这三百道题可能真的白刷了。所以还要不要刷LeetCode?要刷,但别只刷题。刷题的时候,多问自己几个为什么:为什么用这个数据结构?为什么这个解法比那个好?如果换个条件,解法还成立吗?把刷题当成锻炼思维的方式,而不是背答案的任务。毕竟面试官想看到的,从来不是一台背题机器,而是一个能解决问题的人。
国企上岸了的向宇同桌...:最害怕答非所问了,但是频繁反问确定意思又害怕面试官觉得我笨
AI时代还有必要刷lee...
点赞 评论 收藏
分享
评论
35
175
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务