ReAct 是什么?“思考-行动-观察”如何闭环运行?

核心定义

ReAct 是能让大模型“边思考、边行动”的推理框架,让 LLM 像人类一样通过多轮交互解决复杂问题

Thought-Action-Observation 运转逻辑

ReAct 循环中有三大要点:

  • Thought:模型分析当前的局面,大任务拆解成子任务,决定当前最需要做什么
  • Action:根据前面的思考结果,生成具体的操作指令
  • Observation:接收真实环境对操作的反馈结果

这就有了一个闭环:想清楚再做,做完看反馈,基于新反馈接着想

ReAct + Function calling 怎么运转?

在 ReAct 需要与外部系统结合时,免不了调用工具,执行链路如下:

  1. 评估与决策:模型接收用户请求,判断仅靠自身知识无法解答,于是从系统预置的工具箱说明中挑选最匹配的工具
  2. 生成结构化指令:模型按照选定工具的参数要求,输出带有具体变量的调用指令,通常是标准的 JSON 格式(图中的Action)
  3. 业务系统拦截与执行:宿主应用(比如后端的Java 业务代码)拦截到这段 JSON,暂停大模型的生成,在真实的外部环境中发送网络请求或执行相关函数
  4. 结果回传注入:业务系统拿到 API 的真实返回值后,把它打包成观测结果,追加到对话历史中,并重新发给大模型
  5. 分析反馈并响应:模型读取新注入的真实数据重新思考。如果信息充足,就把它转化为自然语言回答用户。如果发现异常或数据不足,则再次发起新的工具调用

#Agent##Agent面试会问什么?##我的求职进度条#
Agent 开发八股 文章被收录于专栏

立志于收录所有的 Agent 开发八股文~

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务