1. 你做过的后训练项目里,最难解决的问题是什么2. SFT 数据你怎么构造,怎样避免模型被训练“油了”SFT 最大的问题不是量不够,而是数据风格太单一,最后把模型训成一种固定腔调:很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层,比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出,每一层的目标都不一样。然后再做难度分桶,避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错,但非常模板化,比如“这是一个非常好的问题,让我们一步一步分析”,这类东西在少量数据里没问题,规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本,保留更接近真实...