简单说，RAG 不是让大模型“死记硬背”所有知识，而是让它在回答前先“翻书”。用户问一个问题，系统先从指定文档中找出相关内容，再让大模型根据找到的内容回答。这样模型不是完全凭训练时学到的东西来回答，而是有外部资料作为支撑。和微调相比，RAG 最大的价值是降低了知识注入的成本。微调一次需要准备数据、训练、评估和部署，而且新知识加入后还可能要重新训练。RAG 则只需要把新文档放进知识库，检索系统就能使用。它主要解决的是大模型知识过时、回答不准确、无法访问私有资料的问题。

点赞回复分享

发布于 05-19 00:54 香港

爵爵想睡觉

广东金融学院

普通 LLM 回答问题时，主要依赖训练阶段学到的内容；RAG 则是在回答前先去资料库里查一遍，把查到的内容带进考场。这样模型回答时有参考材料。和微调相比，RAG 不是为了改变模型本身，而是为了补充模型不知道或记不准的知识。微调更像是重新培训模型，RAG 更像是给模型配一本随时更新的资料册。所以它主要解决知识更新、私有数据接入、答案可追溯和减少幻觉这几个问题。

点赞回复分享

发布于 05-19 00:51 卢森堡

牛客671170840号

RAG 的工作原理主要是：大模型本身负责理解问题和组织语言，外部检索系统负责提供事实依据。用户提问后，系统先检索相关知识，再把检索结果塞进上下文窗口里，模型根据这些内容进行回答。直接微调虽然也能让模型适应某个领域，但它的问题是成本高、周期长，而且很难保证模型一定记住了某条具体知识。RAG 主要解决的是事实性知识的获取问题，尤其适合需要引用公司文档、政策条款、技术手册、法律法规等内容的场景。

点赞回复分享

发布于 05-19 00:48 美国

不想恰蟹钳

惠州学院

RAG 的核心逻辑是先找资料，再写答案。系统会把企业文档、网页、PDF、FAQ 等内容切分成小段，存进向量数据库。用户提问后，系统计算问题和文档片段的相似度，找出最相关的几段内容，再把它们提供给大模型，让模型生成自然语言回答。相比直接微调 LLM，RAG 更像是在模型外面接了一个知识系统。微调适合让模型学会某种任务或语气，但如果只是想让模型掌握一批文档内容，RAG 通常更划算。它解决的主要问题是：模型本身没有这些知识，或者知识经常变化，不适合每次都通过训练来更新。

点赞回复分享

发布于 05-19 00:44 美国

1摸鱼大王1

深圳大学

RAG全称是 Retrieval-Augmented Generation也就是检索增强生成。它的基本思路是：模型在回答问题之前，先去外部知识库、文档库或数据库里检索相关资料，然后把检索到的内容和用户问题一起交给大语言模型，让模型基于这些资料生成答案。它和直接微调 LLM 的区别在于，微调是把知识写进模型参数里，而 RAG 是让模型临时查资料。所以 RAG 主要解决的是知识更新慢、模型容易胡编、私有知识难以直接注入的问题。比如企业内部制度、产品文档经常变化，如果每次都微调模型，成本高又不灵活；用 RAG 只要更新知识库就可以了。

点赞回复分享

发布于 05-19 00:38 日本

好想要offer啊_

门头沟学院

RAG 的流程通常包括：文档清洗和切分、向量化存储、用户问题向量化、相似内容检索、把检索结果拼进 prompt、最后由 LLM 生成回答。整个过程中，大模型并不直接保存所有外部知识，而是在需要时调用相关资料。相比直接微调，RAG 的优势是灵活。比如公司产品说明每周都变，如果用微调，每次更新都要重新训练，很不现实；但用 RAG，只要更新知识库就行。它主要解决的是大模型知识静态化的问题，也就是模型训练完成后无法及时知道新信息、内部资料和具体文档细节的问题。

点赞回复分享

发布于 05-19 00:36 广东

Toxic丶爵

外交学院 C++

1.RAG 的工作流程一般分为两步：第一步是检索，系统把用户的问题转成向量，然后在向量数据库中找到语义最相近的文档片段；第二步是生成，把这些相关片段和问题一起放进 prompt，让 LLM 根据上下文组织答案。 2.如果直接微调大模型，知识会被压缩进参数里，后续要改动或删除都比较麻烦。而 RAG 把知识放在外部知识库里，模型只是调用这些知识。因此 RAG 主要解决的是知识管理问题：知识可更新、可追踪、可替换，也更适合做企业问答、客服、文档助手这类场景。

点赞回复分享

发布于 05-19 00:31 广东

牛客817020644号1

深圳技师学院 C++

RAG 可以理解成给大模型配了一个资料库。当用户提出问题时，系统不会直接让模型凭记忆回答，而是先根据问题去检索相关文本，再把这些文本作为上下文提供给模型。模型最后的回答，是结合自身语言能力和检索结果生成的。相比微调，RAG 的优势在于它不需要反复训练模型。微调更适合改变模型的风格、任务能力或领域表达方式，但不适合频繁更新知识。RAG 主要解决的是模型不知道最新信息的问题，同时还能一定程度减少幻觉，因为回答有资料依据。

点赞回复分享

发布于 05-19 00:29 广东

马里奥离上岸不远了

河北师范大学 Java

RAG:外部知识补充，通过相同向量矩阵的调用，让大模型在不重新训练的情况下，能够利用外部知识库回答事实性、时效性或专业性问题，从而减少“幻觉”并提升答***性。与直接对LLM微调相比，RAG可以实时更新知识库，可以展示检索到的来源，基于检索得到的答案准确性更高。

点赞回复分享

发布于 05-18 20:17 河北

求好运眷顾🙏🏻

东莞理工学院后端工程师

在处理超出其训练数据或需要当前信息的查询时，RAG通过语义相似性计算从外部知识库中检索相关文档块，从而增强了LLM。通过引用外部知识，RAG可有效减少生成与事实不符内容的问题。

点赞回复分享

发布于 05-18 19:34 广东