算法打工人阿旺

2025-07-15 12:08 中山大学算法工程师发布于山东

关注

10道RAG大模型必备面试题

今天老师为大家梳理了10道RAG大模型必备面试题，供各位同学参考。
1️⃣Q1：如何评估RAG生成结果的质量？
A1：① 事实准确性（Factual Accuracy）：对比标准答案；② 引用精确度（Citation Precision）：生成内容与引用文档的相关性；③ ROUGE/L等自动指标（需谨慎，可能与事实性脱钩）。
2️⃣Q2：如何优化检索的召回率（Recall）？
A2：① 使用Query扩展（同义词替换/LLM改写）；② 多向量表示（HyDE生成假设文档再检索）；③ 调整分块策略（重叠分块/多粒度分块）。
3️⃣Q3：RAG如何处理多文档冲突信息？
A3：① 让LLM总结共识点并标注分歧（提示词控制）；② 按文档来源权威性加权（如医学指南>普通文章）； ③ 返回多视角答案（需明确说明冲突存在）。

4️⃣Q4：如何解决“检索偏好”问题（Retrieval Bias）？
A4：当检索结果质量差时强制生成会导致错误。解决方案：① 训练检索评估模块过滤低质结果；② 引入回退机制（如返回“无答案”）；③ 迭代检索（Re-Rank或多轮检索）。
5️⃣Q5：如何优化长文档检索效果？
A5：① Small-to-Big检索：先检索小分块，再关联其所属大文档；② 层次检索：先定位章节，再章节内分块检索；③ 图结构：用知识图谱关联文档片段。
6️⃣Q6：解释HyDE（Hypothetical Document Embeddings）原理？
A6：让LLM根据Query生成假设性答案，将其作为“伪文档”嵌入向量，再用该向量检索真实文档。解决Query与文档表述差异问题。

7️⃣Q7：什么是迭代检索（Iterative Retrieval）？
A7：多轮检索：首轮检索结果输入LLM生成初步答案，再以该答案为新Query二次检索，循环直到满足条件。适合复杂推理场景。
8️⃣Q8：Self-RAG的核心创新点是什么？
A8：引入可学习检索信号：模型自主决定何时检索（Retrieve on Demand），并生成特殊Token（如[Retrieval]、[No Retrieval]）控制流程。
9️⃣Q9：RAG如何适配实时更新知识库
A9：① 检索器使用近实时索引（如Elasticsearch增量更新）；② 生成器无需重训，但需监控新数据分布偏移。
1️⃣0️⃣Q10：用户查询“2025年诺贝尔奖获得者”，但知识库只更新到2024年，RAG如何应对？
A10：设计策略：① 检索器返回最新文档（2024年）；② 生成器明确回答“截至2024年数据，最新获得者为XX，2025年结果尚未公布”；③ 添加时间敏感性警告。
🍊如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

04-09 12:20

门头沟学院嵌入式软件开发

阿里 AI Agent 开发一面（附答题思路）

1. Agent 的架构设计？一个完整的 Agent，一般不是单独一个大模型就能跑起来，核心会拆成几层。最上面是任务入口：负责接收用户问题和上下文；中间是决策层：负责意图识别、任务拆解、规划和工具选择；下面是执行层：真正去调工具、查知识库、访问服务；最后是记忆和状态层：维护多轮上下文、历史执行结果和中间变量。如果做得再工程化一点，通常还会加一个校验层。因为模型规划出来的步骤不一定总是对的，工具参数也可能填错，所以在执行前后都要做检查，比如参数合法性校验、工具返回结构校验、结果一致性校验。Agent 真正难的地方不是 “能不能想”，而是 “想完能不能稳定执行”。2. RAG 的检索如何实现？RA...

查看8道真题和解析

点赞评论收藏

分享

03-22 08:30

门头沟学院推荐算法

数字马力 ai研发一面攒人品

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.为什么要进行数据库的迁移？3.你的实习中还有做了什么工作？4.讲讲你的项目中你觉得亮点的地方5.为什么要用springcloud nacos seata，不用行不行？6. Nacos的数据一致性怎么保证7.为什么用到了concurrentHashmap8.讲讲项目中哪里用到了多线程9.如果给你设计一个表你要考虑什么？10. 索引失效的场景11. 有用过ai工具吗？12 现在让你通过ai工具设计一个用户查询的功能你要怎么做13.了解agent和rag吗

查看13道真题和解析

点赞评论收藏

分享

03-26 13:00

电子科技大学算法工程师

AI应用工程师核心技术栈分享

作为一名正在摸索入行的 AI 应用工程师新人，我把近期收集的资料做了一次系统梳理，聚焦岗位核心能力，把从大模型应用开发、模型调优到工程化部署的全链路技术栈拆解开。一方面给自己定一个清晰的学习方向，避免在海量知识点里越学越乱；另一方面也分享给同样在入门的牛友，一起参考、一起进步。一、核心应用技术1. 提示工程 Prompt Engineering需要熟练掌握角色设定、思维链 CoT、零样本 / 少样本学习、格式约束、抗幻觉等通用技巧；针对 GPT-4o、LLaMA 3、Qwen、Claude 等不同模型做提示词适配，根据问答、摘要、翻译、代码生成等任务做针对性优化。实战上要能搭建可复用的提示词模板库，支持参数化调用和效果评估，解决模型输出不稳定、格式乱、语义跑偏等问题。2. 检索增强生成 RAGRAG 是解决大模型幻觉、落地知识密集型场景的关键，要求能完整搭建一套端到端系统。核心流程包括：文档处理：多格式加载（PDF/Word/TXT/ 网页）、多种文本切分策略向量工程：嵌入模型选型、向量生成与效率优化检索优化：向量检索、混合检索、重排序，提升召回与准确率生成优化：上下文压缩、查询改写、检索结果融合进阶方向可以了解模块化 RAG、GraphRAG、知识库增量更新等方案。3. LLM Agent 开发基于 LangChain /llamaIndex 搭建 Agent，掌握任务拆解、工具调用、结果整合、记忆管理的完整流程；能自定义工具（API、数据库、计算器、外部服务等），设计调用逻辑与失败重试机制。实战要求实现多工具协同、长短记忆管理，能处理数据分析 + 报告生成、多轮复杂问答等场景。二、模型调优与后训练1. 监督微调 SFT能完整设计 SFT 流程：数据集构建与清洗、模型选型、学习率等超参调优；熟练使用 LoRA / QLoRA 轻量化微调，基于 PEFT 库在普通显卡上完成训练，控制显存和成本。最终要能在分类、对话、意图识别等任务上落地微调，并输出对比评估结果。2. 强化学习与偏好对齐了解 RLHF、DPO 的基本思路，能用 TRL 等开源库做简单的偏好对齐训练，减少模型幻觉、违规输出，让生成内容更贴合业务规则。3. 模型压缩与推理优化掌握 INT4/INT8 量化、剪枝、知识蒸馏，用 BitsAndBytes、GPTQ 等工具在可控效果损失下压缩模型；能将模型转为 ONNX / TensorRT，支持本地与边缘部署，提升推理速度。三、工具与框架体系语言与基础：Python、Pandas、Numpy 数据处理深度学习框架：PyTorch、TensorFlow，Hugging Face 全套生态应用开发框架：LangChain、llamaIndexAPI 服务：FastAPI、Flask 封装接口，对接 OpenAI、智谱、通义千问等商用 API四、数据存储与检索结构化存储：MySQL/PostgreSQL 存用户、配置、日志缓存：Redis 做缓存、会话管理、降低重复调用成本搜索引擎：Elasticsearch 做关键词检索向量库：FAISS、Milvus 搭建向量知识库，支撑高并发 RAG 检索五、工程化部署与监控Docker 容器化打包，docker-compose 多组件部署日志与监控：ELK、Prometheus + Grafana 监控接口、推理性能、资源占用安全合规：密钥加密、权限控制、数据脱敏，满足企业安全要求六、前沿技术与行业认知持续关注 LLaMA 3、Qwen、Mistral 等开源模型迭代，以及 LangChain 等工具更新；了解多模态、智能体进化、Modular RAG、知识图谱融合等方向；结合企业服务、智能制造、智能客服等落地案例，学会把技术和业务场景结合，给出可落地方案。

从事AI岗需要掌握哪些技...

点赞评论收藏

分享

03-31 11:15

门头沟学院算法工程师

小红书大模型算法春招二面

继续来分享下之前的面经~欢迎友好讨论，信息共享1- RAG痛点2- 检索精度与召回率的平衡（如chunk粒度优化） 如何解决多跳推理问题？3- 知识更新机制（小红书UGC内容高频更新如何应对4- LLM针对RAG的优化5- 是否用LLM直接生成Embedding？如何解决生成式检索的稳定性6- 提示工程优化（如HyDE技术在小红书的应用场景）。7- 幻觉问题8- 检索结果置信度过滤方案？是否引入知识图谱作为验证层9- 检索污染处理10- 用户生成内容（如错误美妆知识）如何清洗？实时性（如突发谣言）如何应对11- 图文对RAG产品设计12- 多模态检索方案（图文联合Embedding vs. 分离对齐）13- 如何将用户评论/标签纳入检索增强

查看13道真题和解析

点赞评论收藏

分享

03-27 13:18

门头沟学院算法工程师

蔚来实习一面已OC

日期：2026.3.26时长：约40mins面试官：算法工程师（也许是）面试岗位：算法工程师 实习岗工作地：上海内容1 面试官自我介绍2 （我）自我介绍（追问）实习时长？视实习jd而定，对于……，实习期大概在4-5个月3 简历询问a 学生期间的学习经历有什么？i  本科还是硕士？——》都介绍一下ii 本科期间学校对我们专业的培养目标是……，所以我们会学数学、化学、英语、机械、力学、……。在研究生期间，主要学习的课程可以自行选择，我的主修课程主要包括环境感知、智能导航、传感器、ai及深度学习、数学等课程，研究生的主要研究方向就是……。b 我看你的实习经历有一段……，当时就已经在做agent开发了吧？i  我认为严格意义上那不算agent，当时agent也没有现在这么火，更多的还是一个对内的ai助手demo开发，在功能上基本可用。b（追问）那你对ai了解多少，与llm和agent相关的这些。ii 对于llm还有agent的一些基本原理的概念性东西还是有一定程度了解，比如loRA微调、RLHF（是这个吗？其实我不太记得住这个词，可能当时说错了）、数据集、无监督学习、rag、a2a、skills、tool，Transformer等等。但是如果您问我我具体了解程度，那我只能说基本不了解。因为在我的预估和前期规划中，我的实习期从五月开始，这些东西的学习计划是放在四月的（确实是这样规划的）。那么在这之前，我主要做的是我的毕设和一些基础的学习，比如说强化学习的数学原理、经典强化学习算法、Attention、深度学习底层原理等等。之所以这样规划是因为这些东西是介于我毕设和预估中的实习涉及到的技术落地间的重要知识，需要有层次的递进学习，其次是我需要毕设做到一定程度导师才放实习，因此我的毕设进度大概是……。c 介绍一下你最了解的项目。i  我最了解的是我的毕设……。其中我这也是结合prompt engine做的，其中用于项目开发的skill也开源了。c（追问）你为什么选择PPO而不是其他的模型？你有做过对比吗？ii 我选PPO的原因很简单，首先是PPO相对来说非常成熟，其次是它对超参数不是那么敏感，这样我可以不太用耗费很多时间去调参，此外，ppo的代码实现相对来说也比较简洁，能有效减轻我的工作量，最重要的一点是ppo的鲁棒性相对较强，这个是我比较看中的，因为……。对于其他模型而言，比如TRPO，没记错的话TRPO的一大优点在于其理论上能保证策略性能的严格递增，这点也是很重要的，但是没记错的话，TRPO中有个温度系数还是什么超参数，这个超参数对最终的策略提升有重大影响，如果这个参数没调好，容易让策略走向在最优解附近大幅震荡或无法学习的两个极端，这其实是我不希望出现的。毕竟计算机计算精度始终有限，因此我选用一个算法的目的之一在于在有限的计算时间和计算资源的限制之内能最逼近和无线逼近最优解，因此尽管PPO在理论上的收敛性不如TRPO严谨，但是从实际表现来看ppo反而好不少，他就是我需要的算法。c（追问）你的项目不使用数据集来训练对吧？比如那种生成的数据是无法应用到你的项目中的？iii我的项目可以用数据集，强化学习有通过数据集预训练或者需要采样数据的算法，但是，但是，如果使用数据集，我怎么保证我采集到的数据比强化学习自己的策略更好呢？换句话说，这些数据集需要我再环境中自己去采集，人具有主观性，我不能保证我采集到的数据是没有偏差和人的主观偏好在其中，如果基于有偏差的数据进行训练，那么如何保证最终训练出来的策略是最优策略呢？当然我不是在否定这种方法，现在有很多基于数据集驱动的强化学习，若我采用了这种方法，我就需要考虑……系列问题，这会让我毕设的体量爆炸……。因此，在实际中应该结合现有条件进行选择，最适合的才是最好的。4 手撕一个字符串中包含空格和数字，要求不产生额外存储空间的情况，把所有的数字换到左边，同时字符串长度不变（空格放到末尾保留）。忘了这是力扣哪个题，用了双指针的思路，思路对的但是跑不过用例不知道为什么。5 反问a 算力资源？i （面试官所在的团队）有几张gpub ai coding额度资源？i 这些问问llm就行，实习生估计是没有的（我其实无所谓，常年开的有自己的coding账户）c 组织架构？或者团队的主要工作内容是？i （估计是组织架构不便透露）工作内容：i）基于cv的……检测ii）基于ai的……检测iii）基于ai llm的知识图谱构建（听到这眼前一亮）---------分界线---------大约面试结束30-40分钟左右接到hr电话电话内容总结：1 面试官那边总体满意2 jd是……（听到这觉得jd可以去）3 入职时间及实习期（算了一下，可以去）4 薪资5 手头offer确认（表明0 offer，给了就去，期间也会面其他公司，毕竟我知道这个实习岗没有hc，但打包票的是期间我不会跳走）

查看9道真题和解析

点赞评论收藏

分享

评论

3

26

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 父母问你工作找得怎么样，怎么回 #

8991次浏览 126人参与

# 面试被问期望薪资时该如何回答 #

389783次浏览 2177人参与

# 厦门银行科技岗值不值得投 #

19691次浏览 427人参与

# 哪些公司面试还在问八股？ #

4377次浏览 50人参与

# 想从事Agent应该学习哪些技术？ #

1853次浏览 59人参与

# 从投递到OC，你用了多久 #

9148次浏览 79人参与

# 你的秋招第一面感觉怎么样 #

146838次浏览 821人参与

# 有哪些公司在面试时考察AICoding？ #

3297次浏览 45人参与

# 什么人最适合大厂？ #

4518次浏览 41人参与

# HR面都在聊什么？ #

3102次浏览 43人参与

# AI时代还有必要刷leetcode吗？ #

1822次浏览 30人参与

# 你觉得机械有必要实习吗 #

82223次浏览 515人参与

# 哪一刻你突然觉得实习“有点值了” #

7226次浏览 54人参与

# 一人一道大厂面试题 #

133997次浏览 1334人参与

# kpi面有什么特征 #

106160次浏览 506人参与

# 硬件人的简历怎么写 #

341338次浏览 3120人参与

# 通信硬件2023笔面经 #

53758次浏览 322人参与

# 总结:哪家公司最喜欢泡池子 #

171938次浏览 620人参与

# 稳定和高薪机械人更看重哪个？ #

582527次浏览 5568人参与

# 四大天坑是哪四家？ #

113853次浏览 246人参与

# 计算机有哪些岗位值得去？ #

395553次浏览 2938人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务