1. Agent 工具调用你知道怎么训练吗?训练集应该包含哪些?怎么得到训练数据集?如果只是让模型“知道有工具”,那只需要在 SFT 里教会它工具名和参数格式;但如果想让它真的会用工具,训练集必须覆盖完整决策链路。至少要有三类样本:一类是该调用工具的,一类是不该调用工具的,还有一类是要调用多个工具且有依赖关系的。否则模型很容易学成“逢问题必调用”。训练数据来源一般有几种。最理想的是业务日志里已有高质量人工操作轨迹,把用户问题、检索条件、调用参数、返回结果和最终回复串起来。没有现成轨迹时,就要靠规则模板、专家构造、模型自蒸馏和人工校验混合生成。真正难的地方不在造正样本,而在构造反例,比如参数缺失...