继续来分享下最近的面经~欢迎友好讨论,信息共享RAG 架构与检索流程1、为什么引入父子索引?2、为什么在检索阶段引入BM25?(追问)BM25和向量检索是怎样组合的?比例是如何设置的?(追问)整体检索流程是怎样的?从query 到最 终上下文的完整流程是什么?(追问)检索阶段有没有做rerank?使用的是什 么方式?Rerank 与检索结果处理1、rerank后一般返回几个块?(追问)为什么选择这个数量?有没有做过验证?2、rerank后的topK截断是怎么做的?(追问)为什么是这个值?有没有尝试过其他策略?(追问)如果上下文长度不够或过长,你是怎么处理的?上下文工程与记忆机制1、讲一下上下文工程是怎么设计的。(追问)上下文拼接的结构是怎样的?(追问)如何避免上下文过长导致模型性能下降?2、记忆机制是怎么做的?(追问)短期记忆和长期记忆是如何区分和存储 的?(追问)记忆更新策略是什么?Agent设计与工具调用1、Function Calling 是怎么设计的?2、Agent的任务规划是怎么做的?(追问)规划是由模型完成还是通过规则实现?(追问)多工具调用时如何决定调用顺序?(追问)如果工具调用失败如何处理?