字节ai agent一面(地狱难度版)

* 为什么在 RAG 流程中引入父子索引(Parent-Document Retrieval)?
* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?
* 检索融合的具体流程是什么?召回后有没有做 Rerank?
* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?
* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?
* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?
* 请详细讲解分布式令牌桶限流的实现。
* 漏桶算法(Leaky Bucket)的原理讲一下。
* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?
* 滑动窗口和令牌桶相比有什么缺点?
* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?
* LRU 缓存的实现原理讲一下。
* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。
* MySQL 索引会在哪些情况下失效?
* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?
* MySQL 的事务隔离级别有哪些?如何保证一致性?
* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?
* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?
* MySQL 都有哪些锁?它们的作用分别是什么?
* 为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?
* 手撕代码:实现反转链表。
问的好杂,后面有的答不上来了是正常的吗 #Agent面试会问什么?#
全部评论
感觉确实难啊
点赞 回复 分享
发布于 04-12 21:26 北京
答不上是正常的,就是因为你前面都答上来了,才会一直问问到你答不上来,才能知道你强到什么程度
点赞 回复 分享
发布于 04-09 12:04 湖北

相关推荐

04-09 14:27
门头沟学院 Java
抖音基础架构团队1.自我介绍问实习:2.提示词模板是怎么构建的?3.单Agent还是多Agent的?子Agent任务是什么?4.分支覆盖率是怎么统计的?原理有没有了解过?代码插桩具体是怎么实现的?5.对于代码解析有没有前置分析?有效性判断怎么实现的?未来让你来优化这些指标你会怎么设计?6.有没有思考过哪些代码会让模型生成的代码准确度和覆盖率降低?这些用AST和LSP都生成不了单测的代码如何过滤?7.mock是怎么实现的?问项目:8.多维度的查询改写是什么?改写的时候遇到需要用户参与补充信息时怎么设计?技术上怎么实现?9.并行化意图识别是什么?为什么要并行化?如何实现的?10.讲一下项目里召回的流程11.对于上下文工程有什么经验吗?有没有做过to do list?为什么这样会让模型更聚焦,怎么实现的?12.skills的原理有没有了解过?怎么实现的?问八股:13.LLM的底层原理有没有了解?输入给模型的是什么?14.self attention怎么实现的有了解吗?为什么要分成QKV,怎么计算的?同一个token向量是一样的吗?15.python有没有多线程?为什么要有GIL,有没有了解过?多线程的锁都有什么?lock和Rlock有什么区别?16.信号量的底层是怎么实现的?17.cpp编译链接流程有没有了解?编译分哪些步骤?手撕:18.岛屿最大面积19.反问
查看18道真题和解析
点赞 评论 收藏
分享
评论
1
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务