AI-Agent 面试题汇总 - RAG

1. 内容缺失问题是什么?

内容缺失,指的是用户问题明明有答案,但检索阶段没有把真正相关的文档召回出来,最后模型拿到的上下文不完整,回答自然就缺信息。这类问题在 RAG 里特别常见,因为很多时候不是模型不会答,而是它根本没看到关键内容。常见原因就是切块切坏了、向量化效果一般、召回 topk 太小、查询改写不到位,或者知识库本身就缺数据。

2. 为什么会错过排名靠前的文档?

这个问题本质上是检索排序问题。有些文档明明相关,但因为向量检索只看语义相似度,或者 BM25 只看关键词匹配,结果真正有价值的文档没排到前面。尤其是用户问题比较短、表述模糊、专业术语多、别名多的时候,这种情况更明显。所以很多线上系统不会只靠单路召回,而是会做混合检索、重排,尽量把真正能回答问题的文档顶上来。

3. 什么叫脱离上下文?

脱离上下文,就是模型虽然拿到了检索结果,但生成回答时没有严格基于这些内容,而是凭自己已有知识或者语言习惯往外发挥。结果就是答案看上去很完整,但和检索内容不一致,甚至出现幻觉。RAG 不是只要“检索到了”就行,关键还得让模型“基于检索内容回答”。

4. 整合策略的限制是什么?

RAG 里检索回来往往不是一段,而是多段内容。整合策略的限制,指的是这些内容在拼接、筛选、排序、压缩时处理得不够好。比如相关内容被截断、证据分散在不同 chunk 里、顺序错乱、冲突内容没有消解,最后模型虽然“看到了很多内容”,但还是答不好。说白了,不是检索回来越多越好,而是要把真正相关、能组合成答案的内容组织好。

5. 为什么会出现未能提取答案?

有时候文档已经检索到了,但模型还是没把答案抽出来。这通常不是召回问题,而是阅读理解和信息抽取的问题。比如答案藏在表格里、跨段落、表达方式特别绕、需要做一点推理,或者 prompt 没有明确要求“只能提取答案不要发挥”,都会导致模型没提取到关键内容。所以 RAG 后面那一步并不只是“喂上下文”,而是要让模型知道自己到底是做抽取、总结还是推理。

6. 格式错误一般指什么?

格式错误通常是输出格式不符合要求。比如明明要求返回 JSON,结果模型多说了一段解释;明明要求列表,结果返回散文;明明要求字段齐全,结果少键、错键、嵌套层级也不对。这类问题很常见,尤其在 RAG + 工具调用、RAG + 工作流里更明显。所以如果是结构化输出场景,最好别只靠一句“请返回 JSON”,更稳的是 schema 约束、函数调用或者解析失败重试。

import json

text = '{"answer":"可以使用混合检索","confidence":0.91}'
data = json.loads(text)
print(data["answer"], data["confidence"])

7. 特异性错误是什么?

特异性错误,就是回答看上去和问题相关,但不够具体,或者答错了用户真正问的那个细节。比如用户问“某个版本的接口超时原因”,结果回答成了“系统性能优化的一般方法”;用户问“北京地区政策”,结果回答成全国通用政策。本质上是检索粒度和答案粒度没对齐。文档太粗、chunk 太大、query 太泛,最后出来的答案就容易“似是而非”。

8. 回答不全面一般怎么理解?

回答不全面,就是答案只覆盖了问题的一部分。这在多条件、多约束、多步骤问题里特别常见。比如用户问“RAG 的优点、缺点和适用场景”,结果只答了优点。原因通常有两个:一是检索到的证据分散,二是模型只抓住了一个重点。所以复杂问题很多时候要先做 query rewrite 或 query decomposition,把一个大问题拆成几个小问题再检索。

9. RAG 在数据处理上会遇到哪些挑战?

RAG 的难点很多时候不在模型,而在数据。原始数据可能来自 PDF、网页、Word、表格、图片、数据库,格式乱、结构杂、噪声大。如果清洗不好,后面切块、建索引、检索、生成都会一起出问题。所以实际项目里,数据处理往往比“接一个大模型 API”麻烦得多。尤其是扫描件、表格、页眉页脚、重复内容、历史版本混杂,都是典型坑点。

10. 为什么结构化数据查询更难?

因为结构化数据不是纯自然语言文本,它更像表、字段、关系、条件。你让模型去查数据库,本质上不是“语义检索”,而是“把用户问题转成结构化查询”。这时候如果只用普通 RAG 去做,很容易出现字段理解错、条件漏掉、聚合算错的问题。所以结构化数据更适合 Text-to-SQL、知识图谱查询、规则约束或者工具调用,而不是只靠向量检索。

11. 从复杂 PDF 提取数据为什么难?

复杂 PDF 最大的问题是“看起来像文档,机器看起来像一堆布局”。文字、图片、表格、页眉、页脚、脚注、双栏排版、扫描页混在一起时,直接抽出来的文本顺序经常是乱的。一旦文本顺序乱了,后面切块和检索质量就会明显下降。所以复杂 PDF 一般都要先做版面分析,再做 OCR 或文本抽取,再做块级重建,不然知识库质量会很差。

12. 什么是备用模型?

备用模型就是主模型不可用或者效果不稳定时,用来兜底的模型。比如主模型是大参数高成本模型,超时了、限流了、价格太高了,就临时切到一个小模型;或者主模型负责复杂回答,备用模型负责简单摘要、分类、提取。线上系统一般不会只押一个模型,因为 RAG 不只是效果问题,还有稳定性和成本问题。

13. 大语言模型在 RAG 场景里有哪些安全挑战?

主要还是输入污染、提示词注入、敏感信息泄露、越权访问和不可靠输出。比如用户在提问里夹带“忽略之前规则”,或者知识库文档本身藏了恶意指令,模型如果照单全收,就可能把系统 prompt、内部信息或者不该输出的内容带出来。另外,RAG 连接企业知识库时,一旦权限隔离没做好,就可能把不属于当前用户的数据也检索出来。所以 RAG 的安全不是只做输出过滤,而是从检索前、检索中、生成后都要控。

14. RAG 有哪些优点?

RAG 最大的优点就是让模型回答时不完全依赖参数记忆,而是可以临时去查外部知识。这样有几个直接好处:知识更新更快,不用每次改知识都重新训练;回答更容易贴近企业内部资料;可解释性更强,因为可以给出引用文档;成本也通常比频繁做大规模微调更低。对企业来说,RAG 是把通用模型和私有知识连接起来最实用的一条路。

15. RAG 有哪些局限性?

RAG 不是万能的。它依赖检索质量,检索不到就答不好;依赖切块质量,切坏了就容易丢语义;依赖知识库质量,数据脏了效果一定差。另外,它对多跳推理、跨文档整合、表格计算、复杂结构化查询也不总是稳定。还有一个常见问题是链路长,排查难。你最后看到的是“回答错了”,但错在检索、重排、拼接、prompt,还是模型本身,经常要一层层查。

16. 为什么需要 RAG-Fusion?

因为用户问题的表达方式和知识库里的写法经常不完全一致。如果只用原始 query 去

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论
淘天agent开发大量招人,欢迎来撩
点赞 回复 分享
发布于 今天 11:31 浙江

相关推荐

今天 11:44
已编辑
广东药科大学 Java
面试公司:字节跳动面试时间:3.10面试内容:一、自我介绍(5分钟)二、实习+项目拷打 (50分钟+)(一开始紧张没录到音,只能凭记忆了)1.多级缓存方案怎么做的(cdn+本地+redis+mysql)2.怎么保证数据一致性(没用双写一致,将redis作为用户下单的主库存,lua脚本+分布式锁修改redis后用消息队列修改mysql保证最终一致性)3.怎么优化的RAG数据预处理流程(实现DocumentTransformer接口添加元数据)4.项目中的三级缓存是怎么做的(本质Spring三级缓存机制)5.说下日常怎么使用Cursor、cc等ai编程工具进行开发(讲了有无rules约束的效果)6.具体使用了什么检索策略(使用Spring Ai alibaba添加Advisor进行重排序)7.了解重排序的底层吗(说底层使用模型将用户输入和召回的top-k进行分数重排,目的是提高准确率)8.Top-K的K是怎么确定的(对比了默认的10然后逐级递减的方案,确认k=5的时候准确率更高)......(中间可能还有些问题忘了)三、算法(30分钟+)手撕带ttl的lru算法(忘记怎么对比两个时间的差值了,不过面试官说没关系)四、网络相关问题(10分钟+)(听到这个我就知道我要似了,网络最不熟了,不过好在问的不多)1.http和https有什么区别(说了下数字签名和加密算法)2.场景题:将第三方热点放到服务器的本地缓存中,用户连第三方热点后第三方能不能窃读和更改数据(这个真不会回答,随便乱答的)(面试官说让我去了解下数字签名相关的)反问:组内氛围怎么样面试总结: 相比于一面来说难了不少,不过总体来讲还算能对付,面试官看起来非常老练,也会引导我去解决问题,面试体验非常nice,本来一开始很紧张然后聊着聊着就不紧张了,不过场景题没答出来太亏了啊,求面试官别挂我面试结果:面试2天后还没出结果(不会真要挂我吧)
yyyyyyyzz:一面当天出结果,二面现在还没出结果
查看13道真题和解析
点赞 评论 收藏
分享
昨天 20:19
已编辑
门头沟学院 Java
太压力了,面了2个多小时,本菜比已经被拷打的瑟瑟发抖面完两个小时后通知过了1.算法题三道(1)leetcode124 二叉树中最大路径和hard题 因为不久前才刷过撕出来了,又来了一道(2)leetcode 300 最长递增子序列变种除了递增之外还加了一个权重因素,但是思路没变,dp就行(3)寻找词汇库里符合固定长度前缀的匹配单词应该是他们自己题库的题。给了一串单词列表,然后又给了一个单词,一个下标,根据这个下标的前缀去单词列表里面找到所有匹配的单词再返回思路是创建一个单词前缀树,然后根据树找,但是可能是构件树数有问题没撕出来2.全方位项目拷打基本没有问八股,全部都是项目企业场景题,哎哟我操,完全不会。我就纯八股战士,结果没想到一道八股都没问反正尽可能把企业场景往八股上引吧。。1. 微服务多点部署其中一个宕机了怎么办2. 要是mq占据大量CPU该怎么排查?MySQL占据大量CPU该怎么排查?3. 假如说让你实现视频点赞功能,你打算怎么设计?讲讲思路(我知道多级缓存,但是碰巧没背……寄)4. Redis延迟双删是什么,分布式锁,哨兵模式5. MySQL到es同步的延迟该怎么优化6. Rabbit mq的队列是怎么实现的?(这个完全没整明白,可能是队列的底层结构? 反正我硬扯的讲了一下rabbit mq的架构)还扯了很多,但是往后完全就慌了),记住的是这些
查看9道真题和解析
点赞 评论 收藏
分享
评论
2
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务