字节 ai agent 一面分享 攒人品

给我面没招了,发点面经攒攒人品~
1* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?
2* 检索融合的具体流程是什么?召回后有没有做 Rerank?
3* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?
4* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?
5* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?
6* 请详细讲解分布式令牌桶限流的实现。
7* 漏桶算法(Leaky Bucket)的原理讲一下。
8* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?
9* 滑动窗口和令牌桶相比有什么缺点?
10* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?
11* LRU 缓存的实现原理讲一下。
12* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。
13* MySQL 索引会在哪些情况下失效?
14* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?
15* MySQL 的事务隔离级别有哪些?如何保证一致性?
16* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?
17* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?
全部评论
大佬,为什么面agent也会问java后端的这些东西
1 回复 分享
发布于 04-07 15:08 安徽
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 04-03 10:00 广东
是飞书吗
点赞 回复 分享
发布于 04-03 18:23 广东
Chunk数量验证过吗
点赞 回复 分享
发布于 04-03 10:49 北京

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.实习拷打3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?9.chunk切分时为什么要有重叠区域?比例一般怎么确定?10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?11.是否做过关键词召回和向量召回的融合?具体怎么做的?12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?15.rerank之后的截断策略是怎么设计的?为什么选这个 K 值?16.文档发生局部更新时,如何做增量索引而不是全量重建?17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?18.HyDE 在 query 模糊时是如何提升召回效果的?19.超长上下文模型出现后,RAG 架构的必要性是否会下降?20.大模型高并发调用时,如何做限流、降级和成本控制?
点赞 评论 收藏
分享
评论
3
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务