RAG、RAG 类型、Agent 底层原理、多 Agent。

#面试官最爱问的 AI 问题是......#

一、RAG 是什么?(面试必问)

RAG = 检索增强生成(Retrieval-Augmented Generation)
一句话:
先从外部知识库检索相关信息,再把信息喂给大模型生成答案。

作用:

• 解决大模型不知道新知识、幻觉的问题

• 不用重新训练模型,成本低、安全可控

RAG 核心流程(背这 4 步)

1. 文档切分(Chunk)

2. 向量化(Embedding)

3. 存入向量库

4. 用户提问 → 检索相关片段 → 给 LLM 生成答案

RAG 常见类型(面试高频)

1. 朴素 RAG
最简单:切分→向量→检索→生成。
适合简单问答。

2. 高级 RAG(优化版)

◦ 召回前:查询优化、重写

◦ 召回中:多路召回、混合检索(关键词+向量)

◦ 召回后:重排序(Rerank)

3. RAG + 知识库管理
带文档更新、去重、过滤、元数据过滤。

4. 模块化 RAG
可插拔:不同场景用不同检索策略。
二、Agent 底层原理(面试官最爱深挖)

一句话:
Agent = LLM 做大脑 + 工具调用 + 记忆 + 反思 + 规划

核心 5 组件(背这个)

1. 大脑(LLM)
负责思考、决策、理解任务。

2. 记忆(Memory)

◦ 短期记忆:上下文

◦ 长期记忆:向量库/数据库

3. 工具(Tools)
搜索、代码解释器、API、函数调用(FC)。

4. 规划(Planning)
拆解任务、多步推理、自主决定怎么做。

5. 反思(Reflection)
检查结果对不对,错了就修正。

标准执行流程(面试直接说)

1. 理解用户目标

2. 思考:我要做什么?需要哪些工具?

3. 调用工具获取信息

4. 继续推理,直到完成目标

5. 输出最终结果
三、多 Agent 是什么?

多 Agent = 多个智能体分工协作完成复杂任务。

特点

• 每个 Agent 有专属角色

• 互相通信、分工、协作

• 能处理复杂、多步骤、跨领域任务

常见架构

1. 集中式
有一个“主管 Agent”分配任务。

2. 分布式
无中心,Agent 之间互相沟通。

3. 分层式
上层决策,下层执行。

典型应用

• 代码开发团队(产品、前端、后端、测试)

• 内容创作团队

• 企业自动化流程
四、面试高频三连问(标准答案)

1. RAG 和 Fine-tuning 区别?

◦ RAG:外挂知识库,不改模型,安全、实时、成本低。

◦ 微调:改模型权重,适合固定风格/专业领域,成本高。

2. Agent 和普通 LLM 区别?

◦ LLM:你问啥它答啥,被动。

◦ Agent:有目标、会思考、会用工具、自主完成任务。

3. Agent 和工作流区别?

◦ 工作流:固定步骤,按流程跑。

◦ Agent:动态思考,自主决策下一步。
如果你要,我可以直接帮你整理成:
「AI 前端面试 10 分钟速背版」
你拿去背,面试基本稳过。#牛客AI配图神器#
全部评论
27届拼多多实习机会或看我主页 https://careers.pddglobalhr.com/campus/intern?t=4OmKPVeX9a
点赞 回复 分享
发布于 03-31 21:38 上海
谁面试问这么基础的......
点赞 回复 分享
发布于 03-26 17:30 香港
m
点赞 回复 分享
发布于 03-21 00:04 江苏

相关推荐

04-16 03:30
门头沟学院 Java
简直是夯爆了!!!1.实习项目相关问题2.详细介绍一下你做过的智能客服系统。3.你们这套系统主要的应用场景大概是怎么样的?能举个例子介绍一下。4.什么情况下需要用到你的那个 expert 相关技术?5.整套系统的主要难点是在于什么地方?6.中间的 Planner,它的规划机制是怎么样的?比如它底层需要调用哪些工具?是不是需要多轮规划?中间的一些详细设计是怎么设计的?7.你们怎么去评估客服对客户的输出是好还是坏?8.搜索功能是怎么实现的?9.你在中间起到的主要作用是什么?你做出了什么改进?10.你这个迭代的过程中,有 ground truth 吗?比如每一个 query 实际上最终最相关的商品是有哪些?11.你中间做了一些什么样的技术迭代?最终体现在人工评估指标上有什么样的提升?有做过对比吗?12.这个人工评估的指标是怎么设计的?最后它的指标结果怎么样?13.这个指标结果是内部人工评估的,还是线上的结果?14.中间优化的过程中,你们用的是一个什么样的模型?15.你的那个 expert 模型,怎么去训练的?样本从哪里来?16.导购场景的数据是真实的用户跟人工客服对话的场景数据吗?17.训练的样本量大概是多大?18.1000 条样本就足够训练你的这个模型了吗?19.你对比过训练之前跟训练之后,同样的问题模型学习后的能力提升大概有多少?20.你能做到比原始蒸馏出来的模型效果还强吗?21.训这个 8B 的模型用的是多大显存的?什么显卡?八股1.正常来说,1B 的模型在没有做任何量化的情况下,原始 FP 格式存储大概要占到多少显存?2.不考虑梯度的情况,单纯只考虑 Inference,把参数加载到显存里面大概要占多少显存?3.平时有用过一些量化加速的方法吗?4.常用的量化手段比如 INT4、INT8、BF,它们之间怎么做到加速的?你有了解过吗?5.FP 跟 BF 之间的区别,你了解吗?6.FP 和 BF 底层实现的区别主要在哪个地方?7.正常的 MP32 在底层数据存储上,小数是怎么表示的?手撕:有连续的 N 个正整数,随机抽出一个(不拿头尾),将其他数乱序放入 N-1 大小的数组中,找出被取出的数。要求时间复杂度 O (N),空间复杂度 O (1)。
查看28道真题和解析
点赞 评论 收藏
分享
04-12 21:45
门头沟学院 Java
感觉面完人都通透了,还是太菜了,下去沉淀一下1.可以挑一个最近觉得挑战比较大的项目展开介绍一下吗?2.Agent内部具体的实现可以再详细介绍一下吗?3.MCP是把自然语言转成预置查询类的工具吗?4.操作内部平台时,工具会去操作吗?5.系统测试完成后,准确率怎么评估?6.用20%数据作为测试集,是模型跑case后人工评判准确率吗?7.如何对答案进行轨迹级评分?8.目前系统的准确率是多少?9.项目后续继续优化的话,有哪些优化思路?10.现在系统最核心的问题是并发问题吗?11.准确率还有提升空间吗?12.模型输出不符合预期时,prompt会有问题吗?会调prompt吗?13.有考虑过做SFT和强化学习吗?14.目前RAG具体的实现是怎么样的?15.如果用Redis的缓存,会在哪个阶段去做?16.Redis为什么在高并发情况下表现得比较好?17.什么场景下会用多线程?18.RAG作为知识库检索,和把知识库放到ES上让模型调用MCP接口有什么区别?19.若自己实现包含ES检索和向量检索的搜索接口,和RAG有什么区别?20.Redis和MySQL在使用场景上有哪些区别?21.B+树是怎么样的结构?22.B+树和红黑树的区别是什么?MySQL用红黑树效率会更好吗?23.1000万条数据用B+树存储,树的高度大概是多少?24.场景题,给定一个实时输入流(随时可能停,无法全量存储),如何等概率选取5条记录?25.手撕:两个有序数组,O(logN)求合并后第k大的数
查看25道真题和解析
点赞 评论 收藏
分享
评论
13
80
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务