小北的求职树洞

04-05 16:33 哈尔滨工业大学产品经理发布于香港

关注

面试官：大模型幻觉是怎么产生的？

大模型幻觉（Hallucination）是指模型生成与事实不符、缺乏依据或逻辑混乱的内容，其产生根源可从多个维度分析：

数据驱动缺陷
训练数据的噪声与偏见：大模型依赖海量互联网文本训练，而网络数据本身包含错误信息、主观偏见、过时知识甚至虚构内容。模型无法辨别数据真伪，可能将错误模式内化为“知识”。
长尾知识覆盖不足：即使训练数据规模庞大，某些冷门领域或细节知识仍可能缺失。当模型被迫生成此类内容时，可能通过“脑补”填补空白，导致虚构。

数据时效性滞后：模型训练存在时间差（如GPT-4数据截止到2023年10月），无法获取最新事件或研究成果，可能生成过时信息。

概率生成的本质：模型通过最大化token预测概率生成文本，目标是“流畅合理”而非“真实准确”。当高概率路径与事实冲突时，模型优先选择语言连贯性。

缺乏现实世界感知：模型仅学习文本间的统计关联，缺乏对物理世界、因果关系或社会常识的深层理解。例如，可能生成“太阳从西边升起”的合理句式，但违背常识。

自回归生成误差累积：生成过程逐步依赖前文，早期错误（如错误的前提假设）会导致后续内容偏离事实，形成“幻觉链”。

训练目标与评估偏差
损失函数局限性：训练时以预测下一个token的准确性为目标，未直接优化事实正确性。模型擅长模仿语言模式，但缺乏事实核查能力。
缺乏显式知识验证机制：传统架构未内置实时知识检索或逻辑推理模块，无法在生成过程中交叉验证信息真实性。

应用场景的复杂性
模糊性指令的过度泛化：当用户需求模糊（如“写一篇关于量子物理的论文”）时，模型可能虚构术语、引用不存在的文献以完成响应。
对抗性提示诱导：特定提问方式（如“请描述历史上不存在的某场战争”）可能触发模型的创造性生成模式，混淆虚构与事实边界。

缓解幻觉的常见策略

知识增强：引入检索增强生成（RAG），实时调用权威数据库辅助生成。

强化对齐：通过RLHF（基于人类反馈的强化学习）优化模型对“真实性”的偏好。

不确定性标注：让模型主动标记低置信度内容，如“据某些资料显示…”。

#牛客激励计划# #AI产品经理# #产品经理# #聊聊我眼中的AI# #聊聊我眼中的AI# #如果可以选，你最想从事什么工作#
#牛客AI配图神器#

全部评论

推荐最新楼层

04-22 16:32

北京信息科技大学人工智能

决赛圈，怎么选啊，兄弟们帮我一把

👋个人背景：双非研👏offer1：百融云创 （base 北京 AI算法）💯offer2：深信服（base 深圳 AI工程师）🌱offer3：以上两个总包差7达不溜，公积金也差个2.5达不溜

点赞评论收藏

分享

05-08 17:03

已编辑

浙江大学算法工程师

字节暑期实习大模型面经记录！（2/3）已oc

电商治理二面拷麻了持续记录！

面试问题记录

点赞评论收藏

分享

04-13 12:35

被毁约的 或者还没确定好去向的可以再看看这里，春招开了，但是较多岗位有补录以上岗位 大家可以直接投递内推 后台看到比较优秀的我直推到部门接口大家千万别嫌找工作麻烦，说实话找了一个糟心的工作，更麻烦，那种每天的过的很压抑的感觉，真的只能辞职了，就和我学弟当初一样，你会发现投简历时投的懒，等入职之后再办理辞职手续会双倍打回来，我建议至少有四个比较满意的offer了再水，现在多投投，多点选择！当初主要看重这几点，新资有年终奖，最少13薪，全员持股~而且有补充住房公积金，六险二金相当于上海市最高的比例缴纳12%朝十晚六，不打卡！！虽然说偶尔加班是7点多把，但是感觉和去了互联网的比起来 ，已经很友好了 ...

蔚来公司氛围 335人发布

点赞评论收藏

分享

05-25 22:57

电子科技大学人工智能

字节前端实习一面（通过）

飞书前端一面面经：从基础到实战的技术碰撞一、面试初印象这次飞书前端一面给我的整体感受是节奏紧凑且直击技术核心。面试官风格沉稳，问题由浅入深，既考察基础能力，又注重解决实际问题的思维，是一次很有价值的技术交流。二、面试问题复盘1. CSS 基础考察面试官开场便询问我 CSS 基础掌握程度，我坦诚表示“不是很好”，随后进入具体问题：如何实现三列布局，要求两边宽度固定，中间宽度自适应。我首先提到可以用 JavaScript 监听窗口变化动态调整宽度，但面试官希望用纯 CSS 方案。我迅速想到 Flex 布局，并详细解释了实现思路：.container {  display: flex;}.left, .right {  width: 200px; /* 固定宽度 */}.center {  flex: 1; /* 自动分配剩余空间 */}接着，面试官追问 calc() 函数是否了解，由于平时使用较少，我仅简单说明了它能进行四则运算，用于动态计算 CSS 属性值，比如 width: calc(100% - 400px); 可以配合实现响应式布局。2. 项目与性能优化探讨当被问到 项目中的性能优化经验 时，我如实反馈：目前实习项目和个人项目经验较少，尚未深入接触性能优化模块。面试官没有追问，而是迅速切入算法题环节。3. 算法与代码实现题目1：封装 Promise 重试函数要求实现一个函数，传入请求的 Promise 和请求次数，请求失败时自动重试，达到次数上限后不再发起请求。我给出如下代码：function retryPromise(promise, times) {  let count = 0;  return new Promise((resolve, reject) =&gt; {    const run = () =&gt; {      promise        .then(resolve)        .catch((error) =&gt; {          if (count &lt; times - 1) {            count++;            run();          } else {            reject(error);          }        });    };    run();  });}题目2：实现对象深拷贝我先写出基础版本：function deepClone(obj) {  if (typeof obj!== 'object' || obj === null) {    return obj;  }  let result = Array.isArray(obj)? [] : {};  for (let key in obj) {    if (obj.hasOwnProperty(key)) {      result[key] = deepClone(obj[key]);    }  }  return result;}面试官进一步要求 考虑边界情况，我补充说明：若对象属性为数组，需递归处理数组元素；若属性为函数、正则等特殊类型，需特殊处理。例如，对于函数可直接返回原函数，对于正则可创建新的正则实例。三、反问环节我向面试官提出疑问：“为什么在前端面试中如此看重 CSS 基础？”面试官耐心解答：“CSS 是前端页面布局和视觉交互的基石，良好的 CSS 能力能确保页面高效渲染和兼容性，是支撑复杂业务开发的基础，所以我们会重点考察。”四、面试结果与总结幸运的是，面试结果显示 已通过一面。回顾过程，坦诚承认自身不足并积极思考问题，以及在算法题中清晰的逻辑表达是关键。后续准备二面时，我将重点补足 CSS 知识盲区，积累项目实战经验，尤其关注性能优化相关技术，同时加强对 JavaScript 细节和边界场景的理解。这次面试也让我深刻认识到，扎实的基础和灵活的思维永远是技术面试的核心竞争力。

查看5道真题和解析

点赞评论收藏

分享

05-22 21:20

已编辑

杭州电子科技大学 Java

京东零售vs华为15级 offer求选

京东业务是京东零售-平台研发中心-技术保障部-平台研发组，base北京亦庄，公积金12%，白菜价，n*19，但19据说拿不满华为进去再分业务，开了15A，2012软件特战队的，base上海青浦，公积金5%，（n+6）*（14-16）两家工作强度持平，京东白菜价，华为诚意比较足，但华为进去可能转python做算力或者ai小艺，也可能用java或者c++继续做鸿蒙，京东是纯java后端开发，个人还比较担心华为跳槽方向窄的问题，京东纯互联网，方向对口跳槽会容易很多。

点赞评论收藏

分享

评论

2

12

招聘动态

奇安信—菁英计划（26届）

网安一哥可转正实习专场招聘

华泰Fintech星战营

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 写给毕业5年后的自己 #

7016次浏览 123人参与

# 今年形式下双非本找得到工作吗 #

133888次浏览 1008人参与

# 华泰证券Fintech星战营 #

190809次浏览 279人参与

# 职场捅娄子大赛 #

334486次浏览 3372人参与

# 你的秋招第一场笔试是哪家 #

128534次浏览 1399人参与

# 一人一个landing小技巧 #

65045次浏览 1006人参与

# 材料专业就业可以去哪些企业岗位 #

32835次浏览 314人参与

# 汇川技术求职进展汇总 #

120854次浏览 809人参与

# 产品2023笔面经 #

51168次浏览 441人参与

# 哪些公司笔/面试难度大？ #

2558次浏览 19人参与

# 硬件应届生薪资是否普遍偏低？ #

70205次浏览 506人参与

# 我想象的工作vs实际工作 #

470841次浏览 4781人参与

# 今年的你投递了多少份简历才上岸 #

33535次浏览 117人参与

# 通信硬件人社招/春招/实习投递现状 #

24959次浏览 922人参与

# 实习中的菜狗时刻 #

349651次浏览 3218人参与

# 考公VS就业，你怎么选？ #

58669次浏览 393人参与

# 总结:哪家公司面试体验感最差 #

55794次浏览 262人参与

# 工作后会跟朋友渐行渐远吗 #

25817次浏览 191人参与

# 机械人的薪资开到多少，才适合去？ #

107799次浏览 445人参与

# 你的论文盲审过了没？ #

103122次浏览 1468人参与

# 考公还是考研，你怎么选？ #

26030次浏览 131人参与

牛客网
牛客企业服务