02-07 14:57 中国科学技术大学 Java 发布于江苏

关注

基于知识库的agent幻觉降低的实践

在做agent项目的时候，我真正感受到“AI幻觉”并不是抽象概念，而是一个非常具体、非常烦人的工程问题。基于知识库的问答助手，理论上应该“只根据资料说话”，但现实中却频繁出现张冠李戴、虚构事实、甚至把不存在的数据说得头头是道。模型看起来很自信，结果却完全不对。

我们最先做的，其实是最直觉的一步：换更强的模型。能力更强的模型，确实在理解上下文、引用资料时稳定不少，但问题也很快暴露出来——算力和调用成本直线上升，项目根本压不住成本。这一步只能作为兜底，而不是长期方案。

接下来是补资料库。我们发现，很多幻觉并不是“乱编”，而是模型在背景知识不足时强行补全。于是不断扩充文档覆盖面，减少模糊表述，让资料本身更完整、更自洽。这一步很笨，但很有效，背景越扎实，模型胡说的空间就越小。

真正拉开效果差距的，是prompt的优化。我们重新设计了背景设定，明确告诉模型“只能基于给定资料回答”，并且通过#牛客AI配图神器#few-shot示例，让它看到什么是正确引用、什么是信息不足时该如何回答。尤其是示范“无法从资料中得出结论”的回答方式，对减少幻觉帮助很大。

最后我才意识到，幻觉不是单点问题，而是模型能力、知识质量和引导方式共同作用的结果。能做的不是彻底消灭它，而是一步步把它压到工程可接受的范围内。
#为了减少AI幻觉，你注入过哪些设定？#

全部评论

推荐最新楼层

02-07 10:52

复旦大学 Java

入职半年对mentor祛魅

刚来的时候觉得mentor好厉害，什么都会，说话平和。现在发现只是装的好罢了之前让我写个模块，告诉我要改成什么样，按照他说的改完了，也给他看过了。现在准备合入，又问我你为什么要这么写，你不觉得很麻烦吗？你对xx的理解是不是不对？自己工作太忙，跟别人开会沟通不畅，把脾气发在我的代码上，跟同事背后骂我不会写（当着领导的面），反正骂我干的烂是唯一零成本的呗

牛客45361557...：加班加多了，有时候真怀疑自己努力学习是为了什么？不如高中的时候好好玩，报个铁路技校啥的，毕业等分配，照样是舒服日子。辛辛苦苦把自己折腾这么多年，最后也不过是当个牛马，没有一点个人时间

点赞评论收藏

分享

01-26 10:03

哈尔滨工业大学游戏后端

实习产出怎么包装

本篇文章提前先写出来，还没有确定去实习的可以先存着，可能等到你真正拿到实习offer，入职那一天看会更有帮助，对27届实习秋招时间线有疑惑的，认真去读我上一篇帖子，目前都在准备阶段，不知道准备什么的就在龙哥群里找你想去厂的往届真题看看，三年高考，五年模拟先把“包装”这件事的边界讲明白包装不是编故事，更不是把小需求硬吹成架构升级。面试官真正想听的是你有没有工程思维，能不能把一件事讲成闭环。闭环就三句话：你为了解决什么业务问题，做了哪些技术动作，最后拿到了什么可信的结果或证据。把这三句话写扎实，哪怕做的事不“酷”，也会显得很“真”。业务是产出的根，先把“我们在干嘛”搞透实习产出写得空，很多时候不是...

实习如何「偷」产出？

点赞评论收藏

分享

01-31 11:54

已编辑

阿里巴巴_Java研发工程师

阿里飞猪团队急招Java后端

团队急招Java后端，面试难度会适当放低工作地点:杭州阿里巴巴西溪园区有意向的同学欢迎私信！

点赞评论收藏

分享

01-28 22:50

北京工业大学 Java

java水实习写简历里可以包装么？

本人之前有一段一个月的水实习，也没有涉及到具体的工作内容，可以编写一些项目经历写在简历里么？应该如何包装呢？想在年后3月左右找一份日常实习。同时，有没有大佬帮我看看上一条帖子哇哇哇，求助求助！感激不尽

计算机有哪些岗位值得去？

点赞评论收藏

分享

02-04 15:45

中国科学院大学(双一流）算法工程师

拿到华子AI算法岗顶级薪资结果被延毕

本人26届硕，苦苦等到了华子的开奖，并且已经给了14顶的薪资，结果被导以手里课题没做完，论文没投出去不让写毕业论文，延毕半年。华子那边已经撤offer了。不知道下年还有没有机会进华子。也不知道其他厂接不接受延毕的

不入大厂枉为人：就算要延毕也得答辩的时候才确认吧，公司为啥现在就收offer 你自己跟公司说的要延毕了吗

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客吐槽大会 #

29270次浏览 336人参与

# 一份好的简历长什么样？ #

24241次浏览 442人参与

# 春节前，你还在投简历吗？ #

1326次浏览 27人参与

# 春节提前走，你用什么理由请假？ #

747次浏览 19人参与

# 春招什么时候投？ #

454次浏览 11人参与

# 材料专业就业可以去哪些企业岗位 #

55178次浏览 379人参与

# 一上班就想____，这正常吗？ #

17513次浏览 147人参与

# 刚入职就____，这样正常吗？ #

127667次浏览 670人参与

# 校招入职后的感受 #

479319次浏览 3664人参与

# 现在还是0offer，延毕还是备考 #

1283961次浏览 7925人参与

# 设计人秋招体验最好的公司 #

81105次浏览 735人参与

# 招聘要求与实际实习内容不符怎么办 #

166609次浏览 922人参与

# 你觉得机械有必要实习吗 #

73642次浏览 487人参与

# 携程求职进展汇总 #

867215次浏览 5663人参与

# 找实习多的是你不知道的事 #

1790891次浏览 20673人参与

# 机械人选offer，最看重什么？ #

158676次浏览 798人参与

# 设计人的面试记录 #

187713次浏览 1607人参与

# 我的秋招总结 #

280750次浏览 4334人参与

# 聊聊你的职场新体验 #

319623次浏览 1862人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

9212次浏览 230人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务