AI-Agent 面试题汇总 - RAG
1. 内容缺失问题是什么?
内容缺失,指的是用户问题明明有答案,但检索阶段没有把真正相关的文档召回出来,最后模型拿到的上下文不完整,回答自然就缺信息。这类问题在 RAG 里特别常见,因为很多时候不是模型不会答,而是它根本没看到关键内容。常见原因就是切块切坏了、向量化效果一般、召回 topk 太小、查询改写不到位,或者知识库本身就缺数据。
2. 为什么会错过排名靠前的文档?
这个问题本质上是检索排序问题。有些文档明明相关,但因为向量检索只看语义相似度,或者 BM25 只看关键词匹配,结果真正有价值的文档没排到前面。尤其是用户问题比较短、表述模糊、专业术语多、别名多的时候,这种情况更明显。所以很多线上系统不会只靠单路召回,而是会做混合检索、重排,尽量把真正能回答问题的文档顶上来。
3. 什么叫脱离上下文?
脱离上下文,就是模型虽然拿到了检索结果,但生成回答时没有严格基于这些内容,而是凭自己已有知识或者语言习惯往外发挥。结果就是答案看上去很完整,但和检索内容不一致,甚至出现幻觉。RAG 不是只要“检索到了”就行,关键还得让模型“基于检索内容回答”。
4. 整合策略的限制是什么?
RAG 里检索回来往往不是一段,而是多段内容。整合策略的限制,指的是这些内容在拼接、筛选、排序、压缩时处理得不够好。比如相关内容被截断、证据分散在不同 chunk 里、顺序错乱、冲突内容没有消解,最后模型虽然“看到了很多内容”,但还是答不好。说白了,不是检索回来越多越好,而是要把真正相关、能组合成答案的内容组织好。
5. 为什么会出现未能提取答案?
有时候文档已经检索到了,但模型还是没把答案抽出来。这通常不是召回问题,而是阅读理解和信息抽取的问题。比如答案藏在表格里、跨段落、表达方式特别绕、需要做一点推理,或者 prompt 没有明确要求“只能提取答案不要发挥”,都会导致模型没提取到关键内容。所以 RAG 后面那一步并不只是“喂上下文”,而是要让模型知道自己到底是做抽取、总结还是推理。
6. 格式错误一般指什么?
格式错误通常是输出格式不符合要求。比如明明要求返回 JSON,结果模型多说了一段解释;明明要求列表,结果返回散文;明明要求字段齐全,结果少键、错键、嵌套层级也不对。这类问题很常见,尤其在 RAG + 工具调用、RAG + 工作流里更明显。所以如果是结构化输出场景,最好别只靠一句“请返回 JSON”,更稳的是 schema 约束、函数调用或者解析失败重试。
import json
text = '{"answer":"可以使用混合检索","confidence":0.91}'
data = json.loads(text)
print(data["answer"], data["confidence"])
7. 特异性错误是什么?
特异性错误,就是回答看上去和问题相关,但不够具体,或者答错了用户真正问的那个细节。比如用户问“某个版本的接口超时原因”,结果回答成了“系统性能优化的一般方法”;用户问“北京地区政策”,结果回答成全国通用政策。本质上是检索粒度和答案粒度没对齐。文档太粗、chunk 太大、query 太泛,最后出来的答案就容易“似是而非”。
8. 回答不全面一般怎么理解?
回答不全面,就是答案只覆盖了问题的一部分。这在多条件、多约束、多步骤问题里特别常见。比如用户问“RAG 的优点、缺点和适用场景”,结果只答了优点。原因通常有两个:一是检索到的证据分散,二是模型只抓住了一个重点。所以复杂问题很多时候要先做 query rewrite 或 query decomposition,把一个大问题拆成几个小问题再检索。
9. RAG 在数据处理上会遇到哪些挑战?
RAG 的难点很多时候不在模型,而在数据。原始数据可能来自 PDF、网页、Word、表格、图片、数据库,格式乱、结构杂、噪声大。如果清洗不好,后面切块、建索引、检索、生成都会一起出问题。所以实际项目里,数据处理往往比“接一个大模型 API”麻烦得多。尤其是扫描件、表格、页眉页脚、重复内容、历史版本混杂,都是典型坑点。
10. 为什么结构化数据查询更难?
因为结构化数据不是纯自然语言文本,它更像表、字段、关系、条件。你让模型去查数据库,本质上不是“语义检索”,而是“把用户问题转成结构化查询”。这时候如果只用普通 RAG 去做,很容易出现字段理解错、条件漏掉、聚合算错的问题。所以结构化数据更适合 Text-to-SQL、知识图谱查询、规则约束或者工具调用,而不是只靠向量检索。
11. 从复杂 PDF 提取数据为什么难?
复杂 PDF 最大的问题是“看起来像文档,机器看起来像一堆布局”。文字、图片、表格、页眉、页脚、脚注、双栏排版、扫描页混在一起时,直接抽出来的文本顺序经常是乱的。一旦文本顺序乱了,后面切块和检索质量就会明显下降。所以复杂 PDF 一般都要先做版面分析,再做 OCR 或文本抽取,再做块级重建,不然知识库质量会很差。
12. 什么是备用模型?
备用模型就是主模型不可用或者效果不稳定时,用来兜底的模型。比如主模型是大参数高成本模型,超时了、限流了、价格太高了,就临时切到一个小模型;或者主模型负责复杂回答,备用模型负责简单摘要、分类、提取。线上系统一般不会只押一个模型,因为 RAG 不只是效果问题,还有稳定性和成本问题。
13. 大语言模型在 RAG 场景里有哪些安全挑战?
主要还是输入污染、提示词注入、敏感信息泄露、越权访问和不可靠输出。比如用户在提问里夹带“忽略之前规则”,或者知识库文档本身藏了恶意指令,模型如果照单全收,就可能把系统 prompt、内部信息或者不该输出的内容带出来。另外,RAG 连接企业知识库时,一旦权限隔离没做好,就可能把不属于当前用户的数据也检索出来。所以 RAG 的安全不是只做输出过滤,而是从检索前、检索中、生成后都要控。
14. RAG 有哪些优点?
RAG 最大的优点就是让模型回答时不完全依赖参数记忆,而是可以临时去查外部知识。这样有几个直接好处:知识更新更快,不用每次改知识都重新训练;回答更容易贴近企业内部资料;可解释性更强,因为可以给出引用文档;成本也通常比频繁做大规模微调更低。对企业来说,RAG 是把通用模型和私有知识连接起来最实用的一条路。
15. RAG 有哪些局限性?
RAG 不是万能的。它依赖检索质量,检索不到就答不好;依赖切块质量,切坏了就容易丢语义;依赖知识库质量,数据脏了效果一定差。另外,它对多跳推理、跨文档整合、表格计算、复杂结构化查询也不总是稳定。还有一个常见问题是链路长,排查难。你最后看到的是“回答错了”,但错在检索、重排、拼接、prompt,还是模型本身,经常要一层层查。
16. 为什么需要 RAG-Fusion?
因为用户问题的表达方式和知识库里的写法经常不完全一致。如果只用原始 query 去
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.
查看9道真题和解析