快手AI Agent开发一面(已过)

面试1h左右
RAG 架构与检索流程  
1、为什么引入父子索引?  
2、为什么在检索阶段引入BM25?  
(追问)BM25和向量检索是怎样组合的?比例是如何设置的?
(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?  
(追问)检索阶段有没有做rerank?使用的是什 么方式?  

Rerank 与检索结果处理  
1、rerank后一般返回几个块?  
(追问)为什么选择这个数量?有没有做过验证?  
2、rerank后的topK截断是怎么做的?  
(追问)为什么是这个值?有没有尝试过其他策略?  
(追问)如果上下文长度不够或过长,你是怎么处理的?  

上下文工程与记忆机制  
1、讲一下上下文工程是怎么设计的。  
(追问)上下文拼接的结构是怎样的?  
(追问)如何避免上下文过长导致模型性能下降?
2、记忆机制是怎么做的?  
(追问)短期记忆和长期记忆是如何区分和存储 的?  
(追问)记忆更新策略是什么?  

Agent设计与工具调用  
1、Function Calling 是怎么设计的?  
2、Agent的任务规划是怎么做的?  
(追问)规划是由模型完成还是通过规则实现?  
(追问)多工具调用时如何决定调用顺序?  
(追问)如果工具调用失败如何处理?  

安全与防护机制  
1、Prompt注入攻击如何防御?  
(追问)有没有做输入过滤或规则校验?  
2、工具调用的安全控制是怎么实现的?
(追问)如何限制模型调用敏感接口?
(追问)是否有权限控制或白名单机制?  

限流与系统设计  
1、讲一下分布式令牌桶限流。  
2、漏桶算法是什么?  
3、滑动窗口算法是怎么实现的?  
(追问)如果使用滑动窗口,结构体中会包含哪些字段?  
4、滑动窗口和令牌桶相比有什么区别?  
(追问)如果用Redis实现限流,会使用什么数据结构?  

基础算法与数据结构  
1、布隆过滤器讲一下。  
(追问)会出现什么问题?  
(追问)如何控制误判率?  

数据库与索引
1、数据库索引失效的情况有哪些?  
2、like查询会不会导致索引失效?  
(追问)哪些写法会导致索引无法命中?

RAG 评测与数据集  
1、RAG系统如何评测?  
2、有哪些评测维度?  
(追问)常见的指标有哪些?  
3、评测数据集一般包括哪些内容?  
(追问)如何构建高质量评测数据?  

RAG 优化与效果提升  
1、如果要提升相关度,你会怎么做?  
2、如果要优化回答效果,有哪些思路?  
(追问)是优化检索阶段还是生成阶段?  
(追问)如何验证优化是否有效?

系统设计题  
1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?  
(追问)如果数据规模扩大到百万级怎么处理?  
(追问)如何保证计算效率和稳定性?  
RAG 性能优化  
1、RAG的性能如何提升?  
(追问)是从检索、模型还是系统架构优化?  
(追问)有没有做缓存或并行优化?  

上下文优化  
1、当前的上下文是如何处理的?  
(追问)有哪些优化思路?  
(追问)如何减少无关上下文对模型的干扰? #Agent面试会问什么?#
全部评论
请问下agent开发需要具备哪些知识储备呢
点赞 回复 分享
发布于 昨天 14:48 北京
这没有干出手撕来吗?
点赞 回复 分享
发布于 04-13 17:02 湖北
请问什么部门呀
点赞 回复 分享
发布于 04-12 11:28 广东
无手撕嘛
点赞 回复 分享
发布于 04-10 08:30 北京

相关推荐

03-24 01:15
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1* 详细讲讲你设计的 Agent 是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?2*MCP与传统 Agent Skills 的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?3* 在电商或导购场景下,用户的请求往往高度模糊,Agent 怎么来精准理解这种需求?4* 如何设计一套“主动澄清”决策逻辑?在什么情况下 Agent 应该反问用户,什么情况下应该结合历史画像强行推断?5* 针对包含 3 个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?6* 如何衡量 Agent 的 Planning 能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。7* 在多 Agent 协作系统中,不同 Agent 之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?8* Token 过长导致的 Attention 稀释现象为什么会导致 Agent 的指令遵循能力下降?9* 摘要总结往往会丢失关键细节,在长文本 Agent中一般怎么来处理这一块10* 当候选工具超过 100 个时,如何设计路由策略?怎么解决检索过程中的召回偏差?11* 在 Agent 多轮对话任务中,标准 Attention 机制的平方复杂度在工程落地上主要引发了哪些问题?12* 目前有哪些机制可以缓解模型在长上下文对话里的“信息遗忘”现象?当对话论数很多,上下文窗口不够的时候,有哪里处理的策略13* 为什么在复杂的 Agent 闭环场景中,仅靠 RAG 无法彻底解决幻觉问题?14* 面对模型在 Agent 执行过程中出现的循环调用”或陷入思维死循环问题,有哪些解决方式?15* GraphRAG 在处理 Agent 复杂关联查询时的优势在哪里?16* 任务执行远大于单次 Token 限制时,如何设计以支持断点继续生成?17* 设计一个智能导购助手 Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。18* 手撕算法: 给定一个正整数 n(如 23121和一组不重复的数字集合 a(如 \{2,4,9\}),求使用 a 中数字组成的、小于 n 的最大整数。要求考虑贪心回退逻辑,处理所有边界情况。
点赞 评论 收藏
分享
牛客28967172...:跟着卡子哥才是正道,灵茶属实不太行
点赞 评论 收藏
分享
评论
34
169
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务