快手AI agent开发实习生一二面面筋技术栈:Python+go(有两段后端实习)实习做的项目相关:- 为什么引入父子索引,为什么引入BM25,比例是怎样的,具体流程是什么,有没有rerank- rerank后返回几个块,有没有做一些验证- rerank后的topk截断是怎么做的,为什么是这个值,有没有其他方案- 讲一下上下文工程,记忆是怎么做的- 问实习做的后端项目的问题- 分布式令牌桶限流讲一下,漏桶讲一下,滑动窗口算法限流讲一下,如果用滑动窗口结构体会包含什么字段,滑动窗口和令牌桶相比有什么确定,用redis的什么数据结构实现- 问自己做的项目,lru讲一下- 布隆过滤器讲一下- 索引失效的情况(MySQL八股有点忘了,只讲出来两个,被追问了)- like会不会失效- MySQL事物隔离一致性讲一下- mvcc细说,详细追问,问你这种情况会创造几个readview- MySQL锁讲一下手撕:我说我最近实习,很久没刷过题了,出了一道反转链表二面:全是agent,rag相关的,项目相关的,不涉及后端细问rag项目- 如何评测的,有哪些纬度,那些指标- 数据集包括什么- 如果让你对相关度,回答的效果做一些优化,你有什么思路,有没有什么更体系化的思路建设- 如果设计一个数据处理的场景,你会怎么做,比方说有一千条数据,需要求和,你怎么做处理- rag性能如何提升- 你的上下文怎么处理的,有什么优化思路- 长短记忆之间怎么做协同呢- 你有什么思路去对你的agent做优化,让他更智能呢(我感觉这个问题太泛了 不知道具体在问什么,我回答主要针对工程遇到的问题做优化)手撕: 全排列(a了)反问:可能有三面 or hr面业务是做一些内部agent工具和平台技术栈(Python+内部框架)许愿后续