经验就一条:Prompt 一定要拆开,任务一定要变简单。在面对小模型时,它们能力有限,如果把一堆要求(比如整篇文章+要求)塞进一个 Prompt,可能回答的就牛头不对马嘴了——不是主语识别不全,就是逻辑硬伤,或者答案缺斤少两。要把 Prompt 变成“工作流”,每一步只处理一个问题。比如“根据文章提问”,我通常拆成三步:第一步:只让模型识别文章的主语。第二步:根据主语去编问题。第三步:再针对问题生成答案。每步只干一件事,模型想出错都难。再比如做长文本的“分块(Chunk)”处理:不要让模型重写全文,除非你的token值够用,而且还会增加它的思考难度。你可以把原文段落编上号,让模型只输出:“标题...