05-02 11:35 门头沟学院人工智能发布于四川

关注

AI 智能体跑十步就崩，很多人第一反应是模型太蠢，不是马不行，是缰绳没拴

最近的Harness Engineering，你可以理解成给 AI 模型戴上安全带、装上安全气囊的工程实践。

过去两年，我们经历了两个阶段：Prompt Engineering（怎么问）、Context Engineering（喂什么料），但它们对付不了模型多步自主执行时的各种意外。

文章中有一个生动的例子：

让一个智能体写市场分析报告，

前三步相当顺利，

但到第七步突然开始胡编乱造，

因为搜索返回的内容超出上下文窗口被默默截掉了；

第十步输出一段残破的 JSON，整条链路就此夭折，只能重头再来。

要解决这种问题，Harness Engineering 给出四个简单又实用的原则：

能用代码约束的事儿，别指望模型自觉。比如 JSON 格式，别在提示词里苦口婆心求模型输出合法内容，直接上 Schema 验证器，非法输出直接回炉。
关键状态必须外置，不让模型在脑子里憋着。就像你写代码不会只存在内存里一样，模型跑到哪一步、哪些任务完成了、哪些没做，都记到一个外部的 state.json 文件里，这样即使中途崩了，重新启动后还能接着来。
模型输出不能自卖自夸，必须找第三方验收。永远不要让模型给自己的作业评分，因为它总觉得自己很棒。需要一个独立的 Evaluator 模型，它不看原始思考过程，只对结果验收。最好还真能执行一下（跑跑编译器、打开页面看UI），而不是靠想象力评价。
失败要限制在局部，不能一人出错全家连坐。工具调用失败了，就让这一步重试，别搞得整个流程跟着陪葬。

还有几个问题就比如：

有个叫「上下文焦虑症」

上下文一旦占了 70% 以上，模型就变得焦躁，开始跳步骤、草草收尾，好像急着下班一样。解决办法也很直观：别死守污染的上下文，干脆存盘、清空、重启一个干净实例继续干。

其次是「自评骗局」。

模型把稀烂的代码夸成“结构清晰、可读性佳”，根本不可信。真实验收标准必须独立而且有执行过程，不然你迟早翻车。

最后是「记忆整理周期」。

长期运行的智能体日志像凌乱的备忘录，新旧信息打架、浪费 token。这时候要做定期整理，把杂乱的日志压缩成清晰的状态文件。有团队靠这个技巧，把 32K token 的日志压到 7K，还一点不掉关键信息。

当然，让你一开始就搭出这种七层塔楼有点难度。

试试这么写：一个 state.json 存任务状态；

工具调用加 try/catch，失败就指数退避重试；

模型输出全都 Schema 校验；

工具返回的数据统一截断，绝不爆 token。

如果能做到这些，就能大幅提升智能体的任务成功率。

#我的求职进度条##想做Agent可以做哪些岗位？#

大模型集合文章被收录于专栏

这里全放大模型的，需要自取，后面可能没什么空搞这些了。

全部评论

推荐最新楼层

04-30 21:50

门头沟学院 Java

杭州公交云

不过这工资也太低了吧

点赞评论收藏

分享

04-30 20:45

湖南农业大学产品经理

2026求职季：AI简历工具正在让HR失业？

在当今时代，AI技术正以迅猛之势席卷各领域新闻写作早已有AI的身影，它能快速整合信息，生成稿件，大大提高了效率而在安防领域，人脸识别等技术的应用，也让许多安保工作不再完全依赖于人力如此广泛的渗透，不禁让人产生担忧，HR这个岗位是否也会被AI取代？毕竟在招聘等环节，AI已展现出高效筛选简历的能力，这无疑给HR从业者带来巨大的职业危机感，也让无数应届生对未来的求职之路充满焦虑。面对激烈的求职竞争，一份出色的简历至关重要。而AI简历工具恰如救命稻草，能轻松解决简历制作难题。它拥有海量简历模板，无论你是应届生、留学生还是职场人，都能找到合适的选择。只需简单输入个人信息，它就能一键生成简历初稿。无论是社...

实习如何「偷」产出？

点赞评论收藏

分享

04-07 14:37

北京市石景山区业余大学 Java

现在入门ai需要干什么？

入门ai啥也不需要做，首先先去github注册账号，然后再去注册御三家的ai账号，然后分别去体验体验。慢慢的体验下诸多ai明星产品，你就可以去整理一下你的思路了😁😁😁

现在入门AI首先要做什么...

点赞评论收藏

分享

昨天 23:08

杭州电子科技大学大数据开发工程师

如果再给我一次机会

如果春招能重来，我会把精力死磕在项目深挖和AI工具提效上，而不是焦虑地海投。现在回头看，面试官根本不在乎你背了多少八股，他们只看你是否真的解决过复杂场景的痛点。如果是现在，我会把简历里的水项目全删了，只留最硬核的，把精力放在彻底搞透大数据底层的逻辑上，把Doris、Kafka、Flink CDC的架构原理吃透，去死磕一下工业级海量数据并发写入的性能调优。而且，我绝对会早点把Cursor、Claude Code这些AI编程原生工具用熟，把日常敲代码和造测试数据的效率提上来，用省下的时间去深度复盘每一次面试的录音，而不是像无头苍蝇一样每天刷新招聘软件。与其为了拿Offer而焦虑，不如沉下心把核心技...

如果春招能重来，我会__...

点赞评论收藏

分享

昨天 12:56

南京大学 golang

牛客的朋友们怎么感觉逐渐变少了

从22年开始每年招聘季就一直刷牛客，感觉牛客的话题热度有点逐渐冷却的趋势，AI时代以后情况更盛了

匿名用户00001：可能是互联网越来越不适合普通人了，和土木一样

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

快手

27届实习超多转正机会

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

13643次浏览 151人参与

# 金三银四，你的春招进行到哪个阶段了？ #

35587次浏览 332人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

46097次浏览 509人参与

# 如果春招能重来，我会___ #

15284次浏览 182人参与

# Prompt分享 #

77295次浏览 1274人参与

# 除了线上，还能去哪些地方投简历 #

8729次浏览 103人参与

# 校招第一份工作你干了多久？ #

152891次浏览 640人参与

# 硬件人秋招进展 #

292082次浏览 4042人参与

# 你觉得实习能学到东西吗 #

153255次浏览 1480人参与

# 搜狐工作体验 #

6808次浏览 54人参与

# 反问环节如何提问 #

141395次浏览 2740人参与

# 想做Agent可以做哪些岗位？ #

12992次浏览 416人参与

# 面试官拷打AI项目都会问什么？ #

12203次浏览 422人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

6074次浏览 25人参与

# 你觉得最好用的AI编程工具是_ #

4738次浏览 97人参与

# 哔哩哔哩笔试 #

42333次浏览 166人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

14050次浏览 80人参与

# 你实习是赚钱了还是亏钱了？ #

127556次浏览 715人参与

# 大厂还是考编 #

134627次浏览 1399人参与

# 非技术岗简历怎么写 #

338721次浏览 3301人参与

# 实习第一天，你在干什么 #

9138次浏览 111人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务