一、引言这两天系统学习了一遍 RAG,原本以为它就是文档切片 + 向量检索 + 大模型回答这么一条标准流程,但真正从头到尾梳理下来之后,我发现事情没那么简单。RAG 最有意思的地方,不是它用了什么新概念,而是它重新回答了一个很关键的问题:当大模型面对企业知识、私有文档和最新资料时,怎么才能不靠猜,而是基于真实内容回答问题?很多人第一次接触 RAG,都会先记住几个关键词:Embedding、向量数据库、检索、Rerank、Chunk但如果这些概念没有被串成一条完整链路,就很容易变成每个词都认识,但整体还是有点模糊。所以这篇文章,我想不只是罗列概念,而是尝试把 RAG 从头到尾重新讲清楚:文档是怎...