上海某小厂

后端开发/AI工程实习生 - 技术一面

面试问题速览

1. 请做个自我介绍。
2. （针对RAG项目）为什么选择用Elasticsearch来做存储？
3. Elasticsearch和其它常规的向量数据库有什么不一样的地方？
4. （针对AI Agent项目）整个Agent你是怎么去设计的？
5. （针对多轮对话）持久对话是怎么实现的？
6. 了解CAP理论吗？Redis属于哪一种？
7. （针对分布式项目）怎么去选一个leader节点？（Raft协议）
8. （针对后端项目）你这边用了一个RocketMQ，能简单说一说这种消息队列有什么用，具体用在什么场景？
9. （个人情况）现在是开学到大三是吧？实习时间大概是多少？

我的回答策略与复盘

【针对问题】RAG项目中为何选择Elasticsearch？它和专用向量数据库有何不同？

* 【回答策略】
我主要从两个层面回答了这个问题：
1. 工程实践角度：强调了基于已有技术栈和经验进行选型的务实考量。比如，我提到自己熟悉ES，且团队已有的ELK生态便于集成和运维，这展示了成本和效率意识。
2. 技术特性角度：点出了ES的核心优势在于其综合搜索能力。我解释了它不仅支持向量搜索，还能利用其强大的倒排索引进行传统的关键词检索，这对于需要结合多种搜索方式的场景非常有利。

* 【复盘与思考】
* 亮点：面试官对我从工程实践角度出发的回答表示了认可，这表明在初创公司，务实和快速落地的能力很受重视。
* 待优化：现在回想，我的回答应该优先强调技术优势。比如，可以更专业地指出ES的“混合搜索（Hybrid Search）”能力是其在RAG场景下相比Milvus等专用向量库的核心差异点和优势。先说技术核心，再说工程便利性，逻辑会更清晰。

【针对问题】如何设计一个AI Agent？

* 【回答策略】
我将Agent的设计思路拆分成了两个核心部分：
1. 核心大脑（LLM & Prompt Engineering）：讲解了如何通过精心设计的提示词工程（Prompt）来赋予Agent“专家角色”，并引导其进行多轮、有逻辑的提问，而不是一次性给出所有答案。
2. 知识外挂（RAG）：详细说明了如何通过检索增强生成（RAG）技术为Agent挂载外部知识库，确保回答的专业性和准确性，避免模型幻觉。同时，我还提到了对原始数据（如PDF论文）进行清洗、切块和向量化的预处理流程。

* 【复盘与思考】
* 亮点：这个回答展示了系统性思维，将一个复杂问题拆解成了具体的技术模块，并且每个模块都有清晰的实现思路。特别是提到了数据预处理的细节，增加了回答的深度。
* 待优化：可以进一步引入Tool Calling/Function Calling的概念，说明Agent如何调用外部API（如查询天气、数据库）来增强其能力，这样会让设计显得更完整和前沿。

【针对问题】Raft协议的Leader选举过程是怎样的？

* 【回答策略】
因为这是我亲手实现过的项目，所以我非常有信心地按照时间线和状态机转换的逻辑，一步步地阐述了整个流程：
1. 触发条件：从Follower收不到Leader的心跳超时开始讲起。
2. 状态转换：描述节点如何将自己的term加一，并转变为Candidate状态。
3. 选举过程：讲解Candidate如何向其他节点发起投票请求。
4. 达成共识：强调需要获得超过半数的选票才能成为新的Leader。
5. 新王登基：说明新Leader会立即发送心跳给所有Follower，以巩固自己的地位。

* 【复盘与思考】
* 亮点：这是本场面试回答得最好的问题。清晰的逻辑、准确的术语、自信的表达，强有力地证明了我的动手能力和对分布式协议的深刻理解。对于简历上的核心项目，一定要做到这个熟悉程度。

【针对问题】消息队列（RocketMQ）用在什么场景，解决了什么问题？

* 【回答策略】
我没有泛泛地谈理论，而是直接用了一个项目中的具体场景——“大数据量异步导出”——来回答，遵循了经典的STAR原则：
* （S）场景：用户请求导出大量数据，同步处理会导致页面长时间等待，甚至请求超时。
* （T）任务：优化用户体验，同时避免后端服务因长时间重度计算而崩溃。
* （A）行动：引入RocketMQ。Web服务接收到请求后，立即返回“处理中”的响应，并将导出任务作为一个消息扔进队列。后端有一个专门的消费服务去队列里取任务，慢慢处理。
* （R）结果：实现了异步化，前端响应速度极快；同时起到了削峰填谷的作用，保护了后端服务，提升了系统的稳定性和吞吐量。
* 【复盘与思考】
* 亮点：用一个具体的业务故事来包装技术，非常有说服力。这展示了我不仅懂技术，更懂得如何用技术解决实际的业务痛点，这是面试中非常重要的加分项。

上海某小厂

全站热榜

创作者周榜