流程挺快的, 一面和二面的间隔大一点, 二面完几分钟就三面了1. 自我介绍2. 实习拷打 大部分时间都在实习上 总时长感觉1小时左右, 一半的时间都在问实习3. 特征筛选如果不只看相关系数,你会怎么做特征筛选不能只看单变量相关性,因为很多特征单独看不强,但和其他特征组合后才有信息量。更稳的做法通常是先做业务分组和统计稳定性检查,过滤掉高缺失、高漂移、强泄漏和强共线的特征;再结合树模型增益、置换重要性、SHAP 分析和线上可用性做二次筛选。对大模型应用相关任务,还要额外关注特征是不是把未来信息泄漏进来了,比如用到了答案后的行为、后验标签或者系统回写字段。真正好的特征不是“看起来复杂”,而是对目标...