AI-Agent 面试题汇总 - RAG

1. 内容缺失问题是什么？

内容缺失，指的是用户问题明明有答案，但检索阶段没有把真正相关的文档召回出来，最后模型拿到的上下文不完整，回答自然就缺信息。这类问题在 RAG 里特别常见，因为很多时候不是模型不会答，而是它根本没看到关键内容。常见原因就是切块切坏了、向量化效果一般、召回 topk 太小、查询改写不到位，或者知识库本身就缺数据。

2. 为什么会错过排名靠前的文档？

这个问题本质上是检索排序问题。有些文档明明相关，但因为向量检索只看语义相似度，或者 BM25 只看关键词匹配，结果真正有价值的文档没排到前面。尤其是用户问题比较短、表述模糊、专业术语多、别名多的时候，这种情况更明显。所以很多线上系统不会只靠单路召回，而是会做混合检索、重排，尽量把真正能回答问题的文档顶上来。

3. 什么叫脱离上下文？

脱离上下文，就是模型虽然拿到了检索结果，但生成回答时没有严格基于这些内容，而是凭自己已有知识或者语言习惯往外发挥。结果就是答案看上去很完整，但和检索内容不一致，甚至出现幻觉。RAG 不是只要“检索到了”就行，关键还得让模型“基于检索内容回答”。

4. 整合策略的限制是什么？

RAG 里检索回来往往不是一段，而是多段内容。整合策略的限制，指的是这些内容在拼接、筛选、排序、压缩时处理得不够好。比如相关内容被截断、证据分散在不同 chunk 里、顺序错乱、冲突内容没有消解，最后模型虽然“看到了很多内容”，但还是答不好。说白了，不是检索回来越多越好，而是要把真正相关、能组合成答案的内容组织好。

5. 为什么会出现未能提取答案？

有时候文档已经检索到了，但模型还是没把答案抽出来。这通常不是召回问题，而是阅读理解和信息抽取的问题。比如答案藏在表格里、跨段落、表达方式特别绕、需要做一点推理，或者 prompt 没有明确要求“只能提取答案不要发挥”，都会导致模型没提取到关键内容。所以 RAG 后面那一步并不只是“喂上下文”，而是要让模型知道自己到底是做抽取、总结还是推理。

6. 格式错误一般指什么？

格式错误通常是输出格式不符合要求。比如明明要求返回 JSON，结果模型多说了一段解释；明明要求列表，结果返回散文；明明要求字段齐全，结果少键、错键、嵌套层级也不对。这类问题很常见，尤其在 RAG + 工具调用、RAG + 工作流里更明显。所以如果是结构化输出场景，最好别只靠一句“请返回 JSON”，更稳的是 schema 约束、函数调用或者解析失败重试。

import json

text = '{"answer":"可以使用混合检索","confidence":0.91}'
data = json.loads(text)
print(data["answer"], data["confidence"])

7. 特异性错误是什么？

特异性错误，就是回答看上去和问题相关，但不够具体，或者答错了用户真正问的那个细节。比如用户问“某个版本的接口超时原因”，结果回答成了“系统性能优化的一般方法”；用户问“北京地区政策”，结果回答成全国通用政策。本质上是检索粒度和答案粒度没对齐。文档太粗、chunk 太大、query 太泛，最后出来的答案就容易“似是而非”。

8. 回答不全面一般怎么理解？

回答不全面，就是答案只覆盖了问题的一部分。这在多条件、多约束、多步骤问题里特别常见。比如用户问“RAG 的优点、缺点和适用场景”，结果只答了优点。原因通常有两个：一是检索到的证据分散，二是模型只抓住了一个重点。所以复杂问题很多时候要先做 query rewrite 或 query decomposition，把一个大问题拆成几个小问题再检索。

9. RAG 在数据处理上会遇到哪些挑战？

RAG 的难点很多时候不在模型，而在数据。原始数据可能来自 PDF、网页、Word、表格、图片、数据库，格式乱、结构杂、噪声大。如果清洗不好，后面切块、建索引、检索、生成都会一起出问题。所以实际项目里，数据处理往往比“接一个大模型 API”麻烦得多。尤其是扫描件、表格、页眉页脚、重复内容、历史版本混杂，都是典型坑点。

10. 为什么结构化数据查询更难？

因为结构化数据不是纯自然语言文本，它更像表、字段、关系、条件。你让模型去查数据库，本质上不是“语义检索”，而是“把用户问题转成结构化查询”。这时候如果只用普通 RAG 去做，很容易出现字段理解错、条件漏掉、聚合算错的问题。所以结构化数据更适合 Text-to-SQL、知识图谱查询、规则约束或者工具调用，而不是只靠向量检索。

11. 从复杂 PDF 提取数据为什么难？

复杂 PDF 最大的问题是“看起来像文档，机器看起来像一堆布局”。文字、图片、表格、页眉、页脚、脚注、双栏排版、扫描页混在一起时，直接抽出来的文本顺序经常是乱的。一旦文本顺序乱了，后面切块和检索质量就会明显下降。所以复杂 PDF 一般都要先做版面分析，再做 OCR 或文本抽取，再做块级重建，不然知识库质量会很差。

12. 什么是备用模型？

备用模型就是主模型不可用或者效果不稳定时，用来兜底的模型。比如主模型是大参数高成本模型，超时了、限流了、价格太高了，就临时切到一个小模型；或者主模型负责复杂回答，备用模型负责简单摘要、分类、提取。线上系统一般不会只押一个模型，因为 RAG 不只是效果问题，还有稳定性和成本问题。

13. 大语言模型在 RAG 场景里有哪些安全挑战？

主要还是输入污染、提示词注入、敏感信息泄露、越权访问和不可靠输出。比如用户在提问里夹带“忽略之前规则”，或者知识库文档本身藏了恶意指令，模型如果照单全收，就可能把系统 prompt、内部信息或者不该输出的内容带出来。另外，RAG 连接企业知识库时，一旦权限隔离没做好，就可能把不属于当前用户的数据也检索出来。所以 RAG 的安全不是只做输出过滤，而是从检索前、检索中、生成后都要控。

14. RAG 有哪些优点？

RAG 最大的优点就是让模型回答时不完全依赖参数记忆，而是可以临时去查外部知识。这样有几个直接好处：知识更新更快，不用每次改知识都重新训练；回答更容易贴近企业内部资料；可解释性更强，因为可以给出引用文档；成本也通常比频繁做大规模微调更低。对企业来说，RAG 是把通用模型和私有知识连接起来最实用的一条路。

15. RAG 有哪些局限性？

RAG 不是万能的。它依赖检索质量，检索不到就答不好；依赖切块质量，切坏了就容易丢语义；依赖知识库质量，数据脏了效果一定差。另外，它对多跳推理、跨文档整合、表格计算、复杂结构化查询也不总是稳定。还有一个常见问题是链路长，排查难。你最后看到的是“回答错了”，但错在检索、重排、拼接、prompt，还是模型本身，经常要一层层查。