一、RAG(检索增强生成)基础与优化方向RAG是一种结合检索与语言模型生成的技术,核心流程包括:数据收集:将数据分块、生成向量嵌入并存储到数据库;推理过程:根据用户查询检索相关文档,结合提示生成回答。文章提出RAG优化的4个关键方向:分块方法、嵌入模型、向量搜索策略、提示工程,并通过实验验证效果。二、4种优化策略及实验验证分块方法优化目标:平衡块大小,避免过小(丢失上下文)或过大(检索冗余)。实验:尝试“父文档检索器”,同时检索相关片段及其父文档以保留上下文,但结果显示性能下降(如上下文召回率降低),需进一步调整分块逻辑。嵌入模型选择对比:DPR(密集 Passage 检索模型)和Senten...