大模型你别再失忆了!你尔多隆吗?

alt

前言

你问大模型一句:“今天天气如何?”,它可能给你查一下本地今天的天气。 你再问它:“那北京的呢?”,他开始科普起了北京,完全忘了上文中的对话,推算出我们是需要他接着回答北京的天气。 以上是发生在早期各家 AI 助手中出现的问题,丢失上下文记忆。随着技术的发展,模型越来越“大”,这个问题出现的时间点(对话轮数)也越来越靠后。那么问题来了,模型是如何记住上下文的?我们该如何优化,在有限上下文中做更多事情?

大模型根本不记

下面是我在开发AI应用的一个简单的解析图

alt

是的,没错。我们每次的对话,包括之前的内容,都要一起发送给大模型。大模型本身不会去存储这些内容。既然不用存储,那如果不限制时间,岂不是能无限推理?那为何所有模型都有最大上下文?

为何不能无上限推理

我们用开会类比,让所有人(上下文中的每个token)都互相交流(注意力机制计算关联),同时你要记住所有人的发言(上下文),这时会遇到以下几个问题。

  • 注意力算不过来:人越多,沟通成本便会指数级爆炸
  • 内存装不下:GPU的“脑子”不够大
  • 太长反而抓不住重点:就像是人类的“注意力”也会衰减

所以,在质量与数量权衡下,就会有这么一个最大上下文。例如DeepSeek的最新模型DeepSeek V3.2的官方数据是128K。根据换算大概是 8 万字(0.75左右的比例,可以看官方文档)。超过之后就开始失忆了,建议重新开一个对话。

现代如何破局?

现在经常有模型支持百万的上下文,看似突破了限制,其实是使用了稀疏注意力、滑动窗口等技巧。讲人话就是,只计算有关联的部分。或者使用上下文工程之一的RAG(Retrieval-Augmented Generation,检索增强生成),通过一个外部的存储,需要时再查询对应知识。

本质上,仍然没有解决无限上下文,只是优化了对长文的处理方式。

alt

上下文工程

通过前面我们知道了,大模型超级聪明,但是他记忆力不太好(有上下文限制),自己也不太会抓重点。所以就需要这么一个中间人来帮助我们更好的使用大模型。上下文工程就是咱们引导大模型如何理顺眼前的推理任务的一个利器。通过设计,组织和优化输入(Prompt),让他更精准的干活。那上下文工程都要如何实现呢?

信息结构化

回归本质,说到底大模型还是一个计算机程序,对于结构化的内容理解起来,比一大段文字更迅速。在计算机中常见的结构化数据有,列表、表格、JSON。下面使用JSON来展示一下,如何结构化问题。 例子:用户说“我买了件蓝色M码卫衣,订单号456,想退货,因为线头多”,结构化后变成:

{
"订单号": "456",
"商品": "卫衣",
"规格": {"颜色": "蓝", "尺码": "M"},
"诉求": "退货",
"原因": "线头多"
}

另外,如果想标记重点,可以使用双引号,【】或者Markdown语法中的加重(**)来突出。

边做边想边反思

有时候特别复杂的问题,模型能力弱的情况下,大模型不会一下理解你的全部意图。我们所需要就是,首先和大模型对齐认知,不着急去推理后续,先列个计划清单。 然后拆解问题,反思或者总结。 以下是一个示例提示词

请基于以下要求直接给出最终答案,过程中需隐含完成以下思维步骤(无需显式写出):
1. **拆解问题**:识别核心要素、约束条件和潜在陷阱  
2. **多视角推演**:列举至少2种合理路径/观点,评估各自优劣  
3. **关键验证**:交叉检验矛盾点,排除逻辑漏洞  
4. **收敛结论**:综合最优解并预判用户潜在追问  

问题:[在此插入具体问题]

测试效果 alt

以上就是完成了一轮思考。想要多轮还需在程序中设计一个循环判断,这里不过多展示。

压缩对话

我们在与AI对话的过程中,绝大部分内容是推理产物,是可以忽略的。不过,传统编码出来的程序是不会分析语义从而做到内容删减的。这恰好是大模型擅长的东西。 当与AI对话的内容上下文超过90%后,可以将之前进行总结,形成新的上下文,然后新开对话,把压缩后的内容发给大模型。

function call、MCP

大模型是将某个时间节点以前所有的知识学习后的产物,如果不开启联网,那么它就是知识停留在那个时间点以前的很聪明的“古人”。

你问它一个最近的热点新闻,大模型光靠自己可不会像人类一样去百度一下,而是通过设定好的流程先去将搜索引擎查询十到几十条数据,作为背景知识一起"喂"给大模型。所以,假设一款模型不支持联网,你完全可以手动复制粘贴给他。

在早期,我们在开发AI应用时,像联网、天气、股票查询等操作,就可以通过function call技术来实现。它就是一个暴漏给大模型的传统接口。但这项技术也有一定局限,因为它是一个固定的流程,只有开关可调控的组件。并且接口五花八门,还需要开发者去再次开发。 那么有没有把权利放给大模型自主决定操作的方案呢?MCP出现了。

MCP(模型上下文协议,Model Context Protocol)。看名字就能知道它是专门为大模型应用开发所诞生的,相比于上个技术,消除了不同接口之间的差异,并且由大模型自主决定是否调用。下面演示一下神奇之处。

下面我以腾讯位置服务MCP + Cherry Studio + 混元大模型做例子 提示词

从腾讯北京总部大楼去首都机场T3航站楼有多远,到那需要多长时间?

结果 alt

最后

上下文工程还在发展,在Agent开发中或是AI Coding中感受尤为明显。不过,对于大部分使用者,当大模型出现失忆的情况,这边建议是整理下内容,新开个对话!

#聊聊我眼中的AI#
浅入浅出大模型 文章被收录于专栏

尽量让所有人都可以认识,并且使用大模型

全部评论
花花下一篇是不是就要讲,ds的ocr模型是如何解决下文长度过大的问题
点赞 回复 分享
发布于 2025-12-19 00:02 河北
mark
点赞 回复 分享
发布于 2025-12-18 13:48 北京
爱看,多写!
点赞 回复 分享
发布于 2025-12-18 11:31 北京
遇到大模型失忆,直接整理重点新开对话
点赞 回复 分享
发布于 2025-12-18 09:45 上海
花花老师!又上新课了
点赞 回复 分享
发布于 2025-12-18 09:43 北京
怪不得一个对话每次用久了越来越慢
点赞 回复 分享
发布于 2025-12-18 09:43 辽宁
时不时要开新对话
点赞 回复 分享
发布于 2025-12-17 22:54 山东
不能问太多
点赞 回复 分享
发布于 2025-12-17 22:54 山东

相关推荐

2025-12-16 22:19
已编辑
南昌市第三中学 Java
个人背景:27届本科 江西普通一本院校个人经历:小厂->用友->蔚来->美团->腾讯不知不觉已经有了五段实习经历,也快在外面漂泊一年半了,在今年也完成了两年前自己想进大厂的目标,可能在别人看来确实就是一段比较传奇的过程,一步一步都在向上走,也会有很多人来问我相关学习实习的一些问题,我看到了也会尽量去回复,但现在我想给大家说的并不是千篇一律的学习路线,而是我认为更为重要的——勇气与抉择。下面我来分享一下这些年的心路历程最初学习背景:我跟很多人一样,都是刚进入大学才开始接触计算机,也刚刚拥有自己的电脑,在刚开始学习的过程没有任何人来帮助我,给予我相关的指导,完全是自己摸索出来的一条学习路线,不会有如今这样有很多完善好的速成路线,而家里人都在想让我考研,似乎本科以我的学历就业是不现实的。我也很早意识到了学历对于我的限制,所以萌生出了大一就开始实习的想法,但这个想法在当时基本上是不存在。所有人都在抨击我(这里感兴趣的话可以看我最早发的帖子),有的人说本科想进大厂痴人说梦,有的人劝我以我的学历考研才是上策,有的人说我屁都不懂就来卷,总之我很难说去看到有支持的。我大一的时候还没卷成如今这样很多大一实习,当我想找到是否有跟我一样下定决心一步一步往上走的人,我当时是没有找到的,要么是秋招的哀嚎,要么就直接是零实习进大厂(现在我知道,这里所谓的普通学历0实习进大厂的水分有很多,排除真正意义上的运气和实力,其他基本上全是造假作弊,大家自己心知肚明,也要放平心态)这就导致了一个没有先例的情况,很多人也都是拿没有先例来抨击我,包括家里人也不支持我去实习,可能很多人的积极性就会下降,但我从来不会信所谓的不可能,如果没有先例,那我就会是第一个,他们不行,是因为他们没能力,他们坚持不下去。勇气是很重要的,当你发现你身边没有人像你一样,就很少会有人相信你,看好你,但好在,我不在乎。最初实习阶段:在最初3000沟通只有零星几个面试的时候,那感觉确实很不好受,沉没成本太大,得到的正反馈却太少,当时基本上都是一天学八个小时从来不间断,没有周末没有节假日,甚至过年我都在学习,这就导致我现在都会因为我周末偶尔休息的时候会有负罪感,我感觉已经是种病了,我也知道我也可以休息会但控制不了。当时我出去实习口袋里有1w块(这是我高中三年加大一一年存下来的,基本上是很抠很抠,一个月生活费有时候有一千多有时候就五六百,但也算得上是成功攒了一点钱)但第一次总会是很害怕,担心租房被骗,担心工作能力不行,担心被公司坑,担心学校原因导致不能实习等等,基本上在前面几段实习是根本不攒钱的,代课已经花了一万多,加上租房来回,基本上只能说堪堪不负支出,后来远赴北京,作为一个南方人,有很多不适应的地方,但现在回过头来一想,已经在北京呆了一年多了。我知道很多人要么担心学校因素,要么担心赚的还没花的多,种种因素导致了实习的困难,我也很害怕,我的钱会不会最终全部打水漂,学校会不会爆雷,我以后还能顺利实习吗等等。但对于我来说,我能对自己狠下心,我能接受通勤时间一个半小时只为节省那么几百块的房租钱,我能控制自己的消费的欲望,我能每个月大把大把把钱给代课,这可能就是我能够初期实习顺利的原因,这需要勇气,也需要对自己狠。实习中的抉择:在有了两段实习经历后,我的目标就朝着大厂进发,在去蔚来的中途,我oc了七八家中小厂公司,这里面不乏一些待遇极其优越的公司(有一家我真的差点就去了),但我最终还是都拒了,因为我清楚的明白想往上走的,只有公司title会帮你说话,没有人有义务理解你的困难你的坚持,好在最后去了蔚来,也算如愿以偿。从蔚来到美团倒是没有过多纠结,因为在最开始的梦中情厂就是美团,但从美团去腾讯这个决定或许是我人生中的转折点。美团多次挽留我,帮我沟通问hr,基本上就是一定能转暑期然后成功转正,仿佛这年薪40w的工作已经触手可得,所以在拿到腾讯offer的那一刻并没有多高兴,因为我意识到这可能是我此生最接近大厂的一次机会,可能大部分人都会选择留在美团,我也认为这一定是一个好的选择。我能够走到如今,是永远相信自己的判断,我的每一步都是在赌一个好的未来,只不过,这次赌注大了点而已,或许未来我再也进不了这些所谓的大厂,但我赌的不是选择错对,我赌我不后悔。所谓信念支撑:都说人要为自己而活,但我或许做不到,毕竟我身处人情社会,有许多爱我的人在等着我成长,我也不能接受因为能力而再次放弃一段感情,最近喜欢一段歌词:爱我的人相信我我一直在努力改变所有失败为你们而存在爱我的人感谢你你们的爱就算人生不是精彩我也要勇敢的姿态最后的最后,我想给大家传递的从来都不是一个普通学历进入大厂的意气风发,我想给大家传递的,是一股相信自己能够向上的信念和可能性。在没有打比赛能力,没有开源能力,没有学历等各个限制下,我帮大家试出了一条能够向上的路。如果没有先例,那我会是第一个。我们不需要弄虚作假,只靠自己一步一步脚踏实地,哪怕慢一点,不赌自己是否成功,只赌自己不后悔,问心无愧。最后送给大家,也送给自己一段话结束2025:生活可能没你想的那么好,也不会像你想的那么糟,人的脆弱和坚强,都超乎了你的想象,有时候可能脆弱的一句话就泪流满面,有时候你发现自己咬咬牙已经走了很长的路了
等闲_:感觉咱们双非的同学都有一个共性,想证明双非也是能进大厂的,我之前所有的标签都喜欢带着双非,仿佛这样可以像别人证明自己的实力,现在我却不再想证明双非到底能不能进大厂,我的生活的所有者是我自己,享受生活,接受结果
2025年终总结
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
2025-12-20 18:14
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务