快手AI Agent开发一面(已过)

面试1h左右
RAG 架构与检索流程  
1、为什么引入父子索引?  
2、为什么在检索阶段引入BM25?  
(追问)BM25和向量检索是怎样组合的?比例是如何设置的?
(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?  
(追问)检索阶段有没有做rerank?使用的是什 么方式?  

Rerank 与检索结果处理  
1、rerank后一般返回几个块?  
(追问)为什么选择这个数量?有没有做过验证?  
2、rerank后的topK截断是怎么做的?  
(追问)为什么是这个值?有没有尝试过其他策略?  
(追问)如果上下文长度不够或过长,你是怎么处理的?  

上下文工程与记忆机制  
1、讲一下上下文工程是怎么设计的。  
(追问)上下文拼接的结构是怎样的?  
(追问)如何避免上下文过长导致模型性能下降?
2、记忆机制是怎么做的?  
(追问)短期记忆和长期记忆是如何区分和存储 的?  
(追问)记忆更新策略是什么?  

Agent设计与工具调用  
1、Function Calling 是怎么设计的?  
2、Agent的任务规划是怎么做的?  
(追问)规划是由模型完成还是通过规则实现?  
(追问)多工具调用时如何决定调用顺序?  
(追问)如果工具调用失败如何处理?  

安全与防护机制  
1、Prompt注入攻击如何防御?  
(追问)有没有做输入过滤或规则校验?  
2、工具调用的安全控制是怎么实现的?
(追问)如何限制模型调用敏感接口?
(追问)是否有权限控制或白名单机制?  

限流与系统设计  
1、讲一下分布式令牌桶限流。  
2、漏桶算法是什么?  
3、滑动窗口算法是怎么实现的?  
(追问)如果使用滑动窗口,结构体中会包含哪些字段?  
4、滑动窗口和令牌桶相比有什么区别?  
(追问)如果用Redis实现限流,会使用什么数据结构?  

基础算法与数据结构  
1、布隆过滤器讲一下。  
(追问)会出现什么问题?  
(追问)如何控制误判率?  

数据库与索引
1、数据库索引失效的情况有哪些?  
2、like查询会不会导致索引失效?  
(追问)哪些写法会导致索引无法命中?

RAG 评测与数据集  
1、RAG系统如何评测?  
2、有哪些评测维度?  
(追问)常见的指标有哪些?  
3、评测数据集一般包括哪些内容?  
(追问)如何构建高质量评测数据?  

RAG 优化与效果提升  
1、如果要提升相关度,你会怎么做?  
2、如果要优化回答效果,有哪些思路?  
(追问)是优化检索阶段还是生成阶段?  
(追问)如何验证优化是否有效?

系统设计题  
1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?  
(追问)如果数据规模扩大到百万级怎么处理?  
(追问)如何保证计算效率和稳定性?  
RAG 性能优化  
1、RAG的性能如何提升?  
(追问)是从检索、模型还是系统架构优化?  
(追问)有没有做缓存或并行优化?  

上下文优化  
1、当前的上下文是如何处理的?  
(追问)有哪些优化思路?  
(追问)如何减少无关上下文对模型的干扰? #Agent面试会问什么?#
全部评论
接好运
1 回复 分享
发布于 04-21 22:33 北京
根据你的简历问这么多,感觉好多八股
1 回复 分享
发布于 04-19 22:53 浙江
这么多名词,所表征的内容,在人生中第一次的接触一般在什么过程中?
点赞 回复 分享
发布于 04-30 14:58 浙江
就算是大厂真的会问这么多问题的吗,太多了吧😥
点赞 回复 分享
发布于 04-28 20:17 广东
这太吓人了吧
点赞 回复 分享
发布于 04-21 15:08 湖南
这么可怕的吗
点赞 回复 分享
发布于 04-21 11:30 河南
同学拼多多【暑假实习/春招】机会考虑吗?链接见主页,团队氛围好,工作内容挑战性强,转正薪资待遇极具竞争力。可一对一帮查进度,解答过程问题。27实习:https://careers.pddglobalhr.com/campus/intern/detail?t=dcsvrwtijZ
点赞 回复 分享
发布于 04-19 13:55 上海
请问下agent开发需要具备哪些知识储备呢
点赞 回复 分享
发布于 04-16 14:48 北京
这没有干出手撕来吗?
点赞 回复 分享
发布于 04-13 17:02 湖北
请问什么部门呀
点赞 回复 分享
发布于 04-12 11:28 广东
无手撕嘛
点赞 回复 分享
发布于 04-10 08:30 北京

相关推荐

好难,分享面经攒人品。· 在Agent知识闭环中,如何设计决定哪些信息进入向量数据库(长期记忆)、哪些进入上下文窗口(短期记忆)、哪些直接转化为模型权重的元记忆?· 当对话轮数较多且上下文窗口严重不足时,如何在不丢失初始Attention Sink的前提下保持生成的连贯性?· 详细讲讲你设计的Agent是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?· MCP与传统Agent Skills的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?· 在电商或导购场景下,用户的请求往往高度模糊,Agent如何精准理解这种需求?· 如何设计一套“主动澄清”决策逻辑?什么情况下Agent应该反问用户,什么情况下应该结合历史画像强行推断?· 针对包含3个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?· 如何衡量Agent的Planning能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。· 在多Agent协作系统中,不同Agent之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?· Token过长导致的Attention稀释现象为什么会导致Agent的指令遵循能力下降?· 摘要总结往往会丢失关键细节,在长文本Agent中一般怎么处理这一块?· 当候选工具超过100个时,如何设计路由策略?怎么解决检索过程中的召回偏差?· 在Agent多轮对话任务中,标准Attention机制的平方复杂度在工程落地主要引发了哪些问题?· 目前有哪些机制可以缓解模型在上下文对话里的“信息遗忘”现象?当对话轮数很多、上下文窗口不够时,有哪些处理策略?· 为什么在复杂的Agent闭环场景中,仅靠RAG无法彻底解决幻觉问题?模型幻觉在电商这种强事实性场景里怎么治理?这个问题很现实。比如用户咨询某款运动鞋:“这款鞋参加今晚的‘满300减50’活动吗?”如果模型产生幻觉,随口答复,而实际该品牌属于不参加活动的黑名单商家。一旦用户下单后发现没减钱,就会产生大规模的退货和客诉。· 面对模型在Agent执行过程中出现的循环调用或陷入思维死循环问题,有哪些解决方法?· GraphRAG在处理Agent复杂关联查询时的优势在哪里?· 任务执行远大于单次Token限制时,如何设计以支持断点继续生成?· 设计一个智能导购助手Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。
查看19道真题和解析
点赞 评论 收藏
分享
评论
67
345
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务