04-02 22:50 门头沟学院算法工程师

关注

字节 ai agent 一面分享攒人品

给我面没招了，发点面经攒攒人品～
1* 为什么引入 BM25？向量检索和 BM25 的融合比例是怎样的？
2* 检索融合的具体流程是什么？召回后有没有做 Rerank？
3* Rerank 后返回几个块（Chunk）？有没有针对这个返回数量做过验证？
4* Rerank 后的 TopK 截断是怎么做的？为什么是这个值？有没有其他截断方案？
5* 讲一下上下文工程（Context Engineering），Agent 的记忆（Memory）是怎么做的？
6* 请详细讲解分布式令牌桶限流的实现。
7* 漏桶算法（Leaky Bucket）的原理讲一下。
8* 滑动窗口算法限流讲一下。如果用代码实现，滑动窗口的结构体会包含哪些字段？
9* 滑动窗口和令牌桶相比有什么缺点？
10* 在 Redis 中，你会用什么数据结构来实现滑动窗口限流？
11* LRU 缓存的实现原理讲一下。
12* 布隆过滤器（Bloom Filter）的底层原理和适用场景讲一下。
13* MySQL 索引会在哪些情况下失效？
14* 在使用 LIKE 进行模糊查询时，索引什么情况下会失效？
15* MySQL 的事务隔离级别有哪些？如何保证一致性？
16* 详细说说 MVCC 的实现，ReadView 的生成时机是怎样的？
17* 在不同的隔离级别下，一个事务分别会创造几个 ReadView？

全部评论

推荐最新楼层

门头沟学院 Java

大佬，为什么面agent也会问java后端的这些东西

1 回复分享

发布于 04-07 15:08 安徽

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 04-03 10:00 广东

深圳技术大学测试开发

是飞书吗

点赞回复分享

发布于 04-03 18:23 广东

家族企业准备上市

Massachusetts Inst. of Technology 项目经理

Chunk数量验证过吗

点赞回复分享

发布于 04-03 10:49 北京

04-02 23:39

广西大学算法工程师

奇虎 AI Agent开发二面

1. 请做一个简短的自我介绍2. 在你的项目里，挑一个技术难度大点介绍一下3. 你平时工作中用过哪些 AI 编程工具4. 对 Python 掌握如何？在你的实际使用里主要承担什么角色5. 对协程了解吗如果面试官保留“协程”这个点，其实完全可以只从 Python 角度展开。你可以说协程适合 I/O 密集场景，比如异步调用多个外部工具、并发请求检索服务、批量处理模型请求、流式返回等。协程不是让 CPU 计算变快，而是提高等待 I/O 时的资源利用率。在 Agent 场景里，协程比较适合做并发检索、多工具并发探测、异步日志上报、流式 token 处理这些事情。如果继续深入，可以提一下 asyncio...

查看15道真题和解析

点赞评论收藏

分享

03-24 15:15

门头沟学院人工智能

字节番茄AI agent开发二面面经分享

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.实习拷打3.OCR 结果有噪声或错误时，你是怎么做纠错或提升解析质量的？4.多模态检索中，图像和文本向量不在同一空间时，如何实现对齐？5.Agent 中长短期记忆如何设计？各自存什么，怎么触发读取？6.多轮对话中，如果不同轮次的记忆发生冲突，你如何处理？7.用户情绪异常（投诉、愤怒）时，Agent 如何在不中断主流程的情况下进行干预？8.长文档为什么一定要切 chunk 再做向量化？不切会有什么问题？9.chunk切分时为什么要有重叠区域？比例一般怎么确定？10.稠密向量和稀疏向量的区别是什么？各自适合什么场景？11.是否做过关键词召回和向量召回的融合？具体怎么做的？12.向量检索中 Top-K 设置过大或过小分别会带来什么问题？13.余弦相似度和欧氏距离在高维空间中的差异是什么？实际怎么选？14.为什么需要 rerank 模型？它解决了向量召回的哪些问题？15.rerank之后的截断策略是怎么设计的？为什么选这个 K 值？16.文档发生局部更新时，如何做增量索引而不是全量重建？17.RAG 中如果没有召回到相关知识，如何约束模型避免胡编？18.HyDE 在 query 模糊时是如何提升召回效果的？19.超长上下文模型出现后，RAG 架构的必要性是否会下降？20.大模型高并发调用时，如何做限流、降级和成本控制？

点赞评论收藏

分享

03-27 09:51

广西大学算法工程师

美团 AI Agent 开发二面

1. Agent 工具调用你知道怎么训练吗？训练集应该包含哪些？怎么得到训练数据集？如果只是让模型“知道有工具”，那只需要在 SFT 里教会它工具名和参数格式；但如果想让它真的会用工具，训练集必须覆盖完整决策链路。至少要有三类样本：一类是该调用工具的，一类是不该调用工具的，还有一类是要调用多个工具且有依赖关系的。否则模型很容易学成“逢问题必调用”。训练数据来源一般有几种。最理想的是业务日志里已有高质量人工操作轨迹，把用户问题、检索条件、调用参数、返回结果和最终回复串起来。没有现成轨迹时，就要靠规则模板、专家构造、模型自蒸馏和人工校验混合生成。真正难的地方不在造正样本，而在构造反例，比如参数缺失...

AI-Agent面试实战...

点赞评论收藏

分享

03-27 02:30

门头沟学院 Java

字节春招 26Agent开发一面没招了

给我面没招了，发点面经攒攒人品～1、实习拷打2、Agent项目是实习项目还是个人项目?3、Agent在学术上由哪些部分组成?4、Agent如何减少幻觉?在工业场景下怎么做?5、多Agent/多异步任务下，如何防止上下文污染?6、讲一下Agent中的"长短期记忆"7、了解过Agent的设计范式吗?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、Redis为什么单线程?10、当P的本地队列为空或者不为空时，它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似淘宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明微信扫码登录的完整流程和背后发生的原理17、在微服务架构中，服务发现和负载均衡是如何实现的?

点赞评论收藏

分享

03-21 14:59

广西大学算法工程师

影石 AI Agent 开发一面

1、RAG 流程RAG 一般分成离线和在线两部分。离线侧主要做文档接入、清洗、切分、向量化和索引构建。文档来源可以是产品文档、帮助中心、接口文档、历史问答、内部知识库。清洗之后按段落、标题或者固定窗口做切片，再用 embedding 模型把文本转成向量，写入向量数据库，同时保留 metadata，比如文档类型、时间、部门、权限标签。在线侧通常是用户问题进来后，先做 query 预处理，比如改写、纠错、意图识别，然后拿 query 去做检索。检索可以是向量检索、BM25 检索或者混合检索。召回到候选片段后，再做 rerank，把最相关的内容排到前面，最后拼接 prompt 和用户问题一起送给大模...

AI-Agent面试实战...

点赞评论收藏

分享

评论

3

25

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

34845次浏览 437人参与

# 想从事Agent应该学习哪些技术？ #

8599次浏览 289人参与

# 有哪些公司在面试时考察AICoding？ #

19439次浏览 349人参与

# 你的第一家实习公司是什么档次？ #

70299次浏览 335人参与

# HR面都在聊什么？ #

13814次浏览 163人参与

# 26届春招投递记录 #

3640次浏览 42人参与

# 从投递到OC，你用了多久 #

23888次浏览 240人参与

# 大学生该如何认清当下的就业环境？ #

162473次浏览 889人参与

# 什么人最适合大厂？ #

12823次浏览 133人参与

# 哪些公司面试还在问八股？ #

14167次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23172次浏览 285人参与

# 我的求职进度条 #

1115635次浏览 8051人参与

# 如何快速融入团队？ #

50113次浏览 306人参与

# 你觉得什么岗位会被AI替代 #

57266次浏览 371人参与

# 多益网络工作体验 #

68576次浏览 310人参与

# 薪资爆料 #

412689次浏览 2209人参与

# 美团开奖 #

407810次浏览 1805人参与

# 运营来爆料 #

98829次浏览 508人参与

# 你觉得机械有必要实习吗 #

83666次浏览 527人参与

# OPPO求职进展汇总 #

809070次浏览 5441人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务