一、概述与全链路 RAG(检索增强生成):用户提问 → 检索知识库相关片段 → 注入 Prompt → LLM 基于真实数据生成。解决知识截止、幻觉、无法访问私有数据。 Naive RAG(检索-拼接-生成)→ Advanced RAG(Query 改写、混合检索、Rerank)→ Modular RAG(可插拔模块、Agent 动态决策) 文档 → Chunking → Embedding → 向量数据库 用户查询 → Query改写 → 向量化 → 混合检索 → Rerank → Prompt → LLM生成 二、文档处理(Chunking + Metadata) 切分策略 策略 ...