1.自我介绍。2.你在做这个系统的时候,遇到了哪些问题?你是怎么解决的?(后续主线)当时回答了三个方向:文档上传、解析、切分、向量化链路太长,所以用 RabbitMQ 异步解耦;单纯向量检索对关键词、制度条款、专有名词召回不好,所以引入关键词检索和 RRF 融合;Agent 工具调用、ReAct 执行流程、记忆控制这些工程设计。3. 为什么要用 RabbitMQ,你为什么要把文档上传接口和后续处理链路解耦?4. 你说纯向量检索对一些关键词效果不好,所以引入了 Elasticsearch / 关键词检索,并用 RRF 做融合。你为什么要引入关键词检索?纯向量检索有什么问题?5. 你怎么证明加了关键词检索之后效果变好了?有没有指标?6. 向量检索和关键词检索召回的结果怎么合并?7. 你说用了 RRF为什么不直接给语义检索和关键词检索设置权重,然后加权融合?8. RRF 里的 K 值是多少?为什么用 60?调过吗?9. 你文档切分是怎么做的?10. 你设置的 chunk size 是多少?overlap 是多少?过大过小有什么问题,参数调过吗,效果怎么验证。11. 为什么是 800 / 200?依据是什么?(我回答的这个)12. 你了解 Graph RAG / Tree RAG 这类方法吗?13. Graph RAG 适合解决什么问题?14. 图怎么构建?15. GraphRAG的难点是什么?16. 你这个 ReAct 工具调用具体是怎么实现的?17. 模型怎么知道调用哪个工具?后端怎么执行?18. ReAct 的核心思想是什么?举一个例子说明19. 你了解 MCP 吗?它主要解决什么问题?MCP 解决的是模型侧的问题,还是使用方的问题?权限/鉴权怎么做?20. Agent 的记忆机制是怎么设计的?长期记忆怎么设计?用户新开窗口之后还能记住吗?21.如果进一步改进记忆机制,你会怎么改?你的思路是什么?22.图神经网络项目难负样本怎么做的?23.写了一个论文相关的,主要负责什么?核心内容是什么? 知识库怎么增强摘要?24.手撕快排序,撕完问了这是递归的实现,有没有非递归实现的思路?