今天 15:51 华为_系统工程师

发布于上海

关注

第 40 题：Agent 的幻觉（Hallucination）及如何检测和缓解

第 40 题：Agent 的幻觉（Hallucination）及如何检测和缓解

题目

什么是 Agent 的幻觉（Hallucination）？如何检测和缓解？

一、什么是 Agent 的幻觉？

幻觉（Hallucination） 指模型生成与事实不符、或无法由当前输入/工具结果支撑的内容，却以肯定语气呈现。在 Agent 场景下包括：

事实幻觉：编造不存在的数据、事件、API 结果或工具输出。
工具幻觉：声称调用了某工具或得到某结果，但实际未调用或结果不同；或编造不存在的工具与参数。
推理幻觉：推理链中的逻辑错误、因果颠倒、或“想当然”的步骤。
身份/能力幻觉：声称具备某能力或权限而实际没有（如“我已写入数据库”实际未执行）。

Agent 因结合了多步推理与工具调用，幻觉可能出现在“中间推理、工具选择与参数、对工具结果的解读、最终回答”任一环节，且会沿轨迹传播。

二、检测方式

与工具结果对齐：对模型引用的“工具输出”做校验——是否与真实 API/工具返回一致；若模型未调用却声称有结果，则判为工具幻觉。
事实核查：对最终答案中的事实性声称，用检索、知识库或另一模型做验证；对关键数字、实体、日期做一致性检查。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

Ai Agent：面试300问文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造，适配校招、社招全场景，覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题，全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域，拆解考点底层逻辑，分享一线实战经验，助你一站式通关高薪面试。

全部评论

推荐最新楼层

04-27 11:00

深圳大学 Web前端

腾讯-前端实习-面经

一面 面试官非常专业问问题非常有条理，是在我介绍项目的中途插入一些扩展性问题或者基础性八股，一面无手撕1.介绍一下你对 HTTP 这个协议的一些理解2.HTTP2 的多路复用解决了并行发送的问题，但是在一条链路中并行发送 123 这些数据，它怎么知道哪些数据是属于第一个请求？哪些属于第二个请求？接收端它怎么知道当前收到这个数据包，它是属于一还是属于 2 还是属于3？3.有没有更深入一点的理解HTTP2 头部压缩是做什么？4.HTTP 的缓存机制5.项目实际项目之中是怎么去配置和怎么利用协商缓存和强缓存机制？实际项目中应该怎么去考量这个时间和过期机制？6.加载相关的优化业界是有哪些常见的优化方案？7.CDN详细说一下8.懒加载是怎么达到优化效果？以及它的核心理念是怎么样的？9.无限滚动那种场景除了你刚刚说的这个懒加载，这种长列表还有没有其他一些优化点呢？10.上面已经滚动到可视区以外的内容进行一个处理，具体是做了什么？（回收DOM）11.介绍一个你觉得最能体现你技术能力的一个功能或项目12.长列表的图片的延迟加载。用户他可能很快的往下滑，比如说他当前是属于第一屏。他下面的第二、第三屏，你们是先用占位的空间占着那个图片的位置。用户他可能一滑的话立马划过了，一下子到了第五、第六屏。那么第二、第三屏这些被他快速划过了，你们还会继续去加载渲染图片吗？（回答防抖优化）13.平时在开发项目和学习的过程中，你是有用 AI 吗？14.开发项目的流程之中有没有使用 AI 去帮你开发项目？会用哪些 AI 的工具呢？15.IDE 相关的有没有用？比如说 cursor 啊？平时 cursor 开发具体是怎么去用吗？比如说让它去给你开发项目的时候。16.用这种 cursor agent AI 给你开发这个过程之中，你觉得会有哪些坑？17.有没有了解过业界在编程使用 AI 的一些最佳实践或工作流？或者一些相关的配套的 skill MCP 还有实践经验来帮你更好的开发呢。18.除了开发之外，在哪些编程的节点或流程上，你觉得可以用 AI 继续进行一些辅助或者是提效的呢。19.在实际使用中或者你什么经验去怎么去review，或者是测试 AI 的产出，避免幻觉呢？20.有没有了解过多 agent 甚至是 team 模式？你觉得怎么利用多 agent 甚至是 agent 质检的这种模式在接入我们的开发流程之中呢？你觉得比较理想的，又能提高效率，又能提高 agent 的自身的代码质量的一个流程是怎么样？21.你平时是怎么去关注现在迭代很快的 AI 知识，或者是一些理论或一些实践22.有了解最近 Git上在编程方面有哪些比较火的一些项目吗？23.有没有自己搭一些openclaw？二面面试官也非常好1.实现流式传输，为什么选择RXJS，而不是用原生的event source？ RXJS的核心价值是什么？2. SSE 和 Web SOCKET 有什么区别？3.流式输出的话在前端怎么渲染的？是逐字的去追加 DOM 呢？还是做缓冲区批量更新？有没有遇到一个频繁的DOM 更新导致的性能问题4.文件上传解析这部分前端主要负责的哪些部分？主要做了些什么？5.在这个项目中，你觉得前端部分和后端部分的工作量大概是什么比例？6.keepalive的作用7.typescript 的 type 和interface有什么区别？8.BFC是什么？9.从这个浏览器地址栏输入一个 URL 地址到页面呈现的一个过程10.webpack和vite11.算法题：防抖12.前面几次面试的不足点13.vue、node更擅长哪一块？14.职业发展方向？15.AI 的这个辅助编码和独立编码怎么看16.让你快速上手react ，会有一些什么方式三面实习经历为什么会考虑前端开发自学前端的学习路径选一个有挑战性的项目讲讲，有没有可以优化的点学习 AI 大概多久了skill 跟 MCP 有什么区别有开发过 skill 吗openclaw怎么实现用户需求的个人规划实现一个谷歌、百度首页搜索框要注意哪些点？算法：找一个链表中间的节点、找一个链表倒数第n个节点已oc，祝大家早日上岸

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-30 16:00

某小说公司面试感受

既然已经出结果了，也锐评一下这家公司的面试流程（nbcs）。个位数的岗位，简历也不知道是不是真的认真筛过，貌似不相关经历的也邀请来面试，候选人池子之深可想而知。于是乎面试一个岗位分了上午，中午，下午各个场次，还不止一天，给主包安排在早上8点多，前滩这个地方附近也没有实惠的酒店，于是得从酒店很早起床来参加线下面试。到了地方还得先听一边HR介绍公司，介绍完又领到一个地方等。面试遇到三个面试官+HR，一个面试官全程不说话，从不正眼看人，甚至一脸戏谑，不知道在打量什么；一个全程戴口罩，是感冒了还是咋的了也不知道。提的问题和简历的经历项目毫无关联，面试者回答完没有任何反应，毫无交流，反而像走流程一样，奇...

点赞评论收藏

分享

05-01 20:33

中南大学后端工程师

27 0实习暑期实习总结

bg末9本，0实习，纯java，无agent，共投递13家，约面2家，全部官网投递。3.23投递：京东简历挂，腾讯wxg 二面挂，csig 二面挂，wxg一面拒了3.27投递：携程offer，美团a0挂4.7投递：拼多多a3挂，滴滴，网易互娱简历挂4.12投递：华为测评挂，虾皮简历挂4.17投递：小米，vivo，影石360，全简历挂4.22投递：快手简历挂

点赞评论收藏

分享

今天 15:50

华为_系统工程师

【面试真题】百度 Agent 面经

面完之后：按记忆把题串起来说 手里那份问题清单，是好几场面谈里碎片问题的合集。 单独看每一条都像八股，串在一起你会发现面试官的注意力一直在两条线上晃：一条是「这东西在线上会不会出事」，一条是「你知不知道自己在用什么、没用上什么」。 下面按我自己后来复盘时觉得顺的思路写——从项目怎么讲，一路滑到 LangGraph、记忆、agent 形态、工具协议、RAG，最后落到后端那几道「看起来基础、其实能问穿」的题。 你如果对某一块熟，可以快速扫小标题跳读。 从项目讲起：先别急着报框架名 几乎所有 agent 岗都会从项目开刀。我踩过的坑是开场三十秒就把 LangGraph、LangChain、某某向量库...

Ai Agent：面试3...

点赞评论收藏

分享

04-28 10:19

东南大学 Java

双九还没找到暑期，是不是太菜了

投票

BG：双9，计算机，一段4个月非BAT大厂传统后端实习。截止目前，面了十几场，不少说我技术扎实、对自己做的东西清楚的，但同时说我表达能力较弱、AI实践不够。但没有一个offer现在都要有Agent实际项目吗，普通的练手项目根本没用啊😭怎么办呢？今年暑期这么难吗，还是我太菜了😵统计下大家的进度：

27届求职交流

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

15284次浏览 159人参与

# 26届秋招投递记录 #

124370次浏览 686人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

46533次浏览 510人参与

# 如果春招能重来，我会___ #

16495次浏览 189人参与

# 你觉得实习能学到东西吗 #

153476次浏览 1486人参与

# 除了线上，还能去哪些地方投简历 #

9452次浏览 105人参与

# 大家每天通勤多久？ #

119228次浏览 1652人参与

# 为了实习逃课值吗？ #

81821次浏览 579人参与

# 想做Agent可以做哪些岗位？ #

13862次浏览 429人参与

# 互联网公司评价 #

535655次浏览 4187人参与

# 面试官拷打AI项目都会问什么？ #

13934次浏览 460人参与

# 九月了，是考研还是就业？ #

109946次浏览 610人参与

# 金三银四，你的春招进行到哪个阶段了？ #

36065次浏览 334人参与

# 你觉得最好用的AI编程工具是_ #

5136次浏览 98人参与

# 实习，不懂就问 #

214899次浏览 1710人参与

# 浅聊一下我实习的辛苦费 #

291467次浏览 1801人参与

# 一份好的简历长什么样？ #

41542次浏览 503人参与

# 通信硬件薪资爆料 #

1318406次浏览 7290人参与

# 京东美团大战，你怎么看？ #

186289次浏览 913人参与

# 实习第一天，你在干什么 #

10125次浏览 116人参与

# 实习要如何选择和准备？ #

159780次浏览 1587人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务