字节ai agent一面(地狱难度版)

* 为什么在 RAG 流程中引入父子索引(Parent-Document Retrieval)?
* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?
* 检索融合的具体流程是什么?召回后有没有做 Rerank?
* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?
* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?
* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?
* 请详细讲解分布式令牌桶限流的实现。
* 漏桶算法(Leaky Bucket)的原理讲一下。
* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?
* 滑动窗口和令牌桶相比有什么缺点?
* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?
* LRU 缓存的实现原理讲一下。
* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。
* MySQL 索引会在哪些情况下失效?
* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?
* MySQL 的事务隔离级别有哪些?如何保证一致性?
* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?
* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?
* MySQL 都有哪些锁?它们的作用分别是什么?
* 为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?
* 手撕代码:实现反转链表。
问的好杂,后面有的答不上来了是正常的吗 #Agent面试会问什么?#
全部评论
感觉确实难啊
点赞 回复 分享
发布于 04-12 21:26 北京
答不上是正常的,就是因为你前面都答上来了,才会一直问问到你答不上来,才能知道你强到什么程度
点赞 回复 分享
发布于 04-09 12:04 湖北

相关推荐

04-09 14:27
门头沟学院 Java
抖音基础架构团队1.自我介绍问实习:2.提示词模板是怎么构建的?3.单Agent还是多Agent的?子Agent任务是什么?4.分支覆盖率是怎么统计的?原理有没有了解过?代码插桩具体是怎么实现的?5.对于代码解析有没有前置分析?有效性判断怎么实现的?未来让你来优化这些指标你会怎么设计?6.有没有思考过哪些代码会让模型生成的代码准确度和覆盖率降低?这些用AST和LSP都生成不了单测的代码如何过滤?7.mock是怎么实现的?问项目:8.多维度的查询改写是什么?改写的时候遇到需要用户参与补充信息时怎么设计?技术上怎么实现?9.并行化意图识别是什么?为什么要并行化?如何实现的?10.讲一下项目里召回的流程11.对于上下文工程有什么经验吗?有没有做过to do list?为什么这样会让模型更聚焦,怎么实现的?12.skills的原理有没有了解过?怎么实现的?问八股:13.LLM的底层原理有没有了解?输入给模型的是什么?14.self attention怎么实现的有了解吗?为什么要分成QKV,怎么计算的?同一个token向量是一样的吗?15.python有没有多线程?为什么要有GIL,有没有了解过?多线程的锁都有什么?lock和Rlock有什么区别?16.信号量的底层是怎么实现的?17.cpp编译链接流程有没有了解?编译分哪些步骤?手撕:18.岛屿最大面积19.反问
查看18道真题和解析
点赞 评论 收藏
分享
04-09 16:25
门头沟学院 Java
面试1h左右RAG 架构与检索流程1、为什么引入父子索引?2、为什么在检索阶段引入BM25?(追问)BM25和向量检索是怎样组合的?比例是如何设置的?(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?(追问)检索阶段有没有做rerank?使用的是什 么方式?Rerank 与检索结果处理1、rerank后一般返回几个块?(追问)为什么选择这个数量?有没有做过验证?2、rerank后的topK截断是怎么做的?(追问)为什么是这个值?有没有尝试过其他策略?(追问)如果上下文长度不够或过长,你是怎么处理的?上下文工程与记忆机制1、讲一下上下文工程是怎么设计的。(追问)上下文拼接的结构是怎样的?(追问)如何避免上下文过长导致模型性能下降?2、记忆机制是怎么做的?(追问)短期记忆和长期记忆是如何区分和存储 的?(追问)记忆更新策略是什么?Agent设计与工具调用1、Function Calling 是怎么设计的?2、Agent的任务规划是怎么做的?(追问)规划是由模型完成还是通过规则实现?(追问)多工具调用时如何决定调用顺序?(追问)如果工具调用失败如何处理?安全与防护机制1、Prompt注入攻击如何防御?(追问)有没有做输入过滤或规则校验?2、工具调用的安全控制是怎么实现的?(追问)如何限制模型调用敏感接口?(追问)是否有权限控制或白名单机制?限流与系统设计1、讲一下分布式令牌桶限流。2、漏桶算法是什么?3、滑动窗口算法是怎么实现的?(追问)如果使用滑动窗口,结构体中会包含哪些字段?4、滑动窗口和令牌桶相比有什么区别?(追问)如果用Redis实现限流,会使用什么数据结构?基础算法与数据结构1、布隆过滤器讲一下。(追问)会出现什么问题?(追问)如何控制误判率?数据库与索引1、数据库索引失效的情况有哪些?2、like查询会不会导致索引失效?(追问)哪些写法会导致索引无法命中?RAG 评测与数据集1、RAG系统如何评测?2、有哪些评测维度?(追问)常见的指标有哪些?3、评测数据集一般包括哪些内容?(追问)如何构建高质量评测数据?RAG 优化与效果提升1、如果要提升相关度,你会怎么做?2、如果要优化回答效果,有哪些思路?(追问)是优化检索阶段还是生成阶段?(追问)如何验证优化是否有效?系统设计题1、如果设计一个数据处理场景,比如有一千条数据需要求和,你会如何设计处理流程?(追问)如果数据规模扩大到百万级怎么处理?(追问)如何保证计算效率和稳定性?RAG 性能优化1、RAG的性能如何提升?(追问)是从检索、模型还是系统架构优化?(追问)有没有做缓存或并行优化?上下文优化1、当前的上下文是如何处理的?(追问)有哪些优化思路?(追问)如何减少无关上下文对模型的干扰?
Agent面试会问什么?
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务