使用精确率-召回率曲线(Precision-Recall Curve)或 F1-Score 作为主要的模型评估指标,而不是准确率(Accuracy)。
在进行交叉验证(Cross-Validation)之前,先对整个数据集进行上采样(Oversampling),以平衡正负样本比例。
采用代价敏感学习(Cost-Sensitive Learning),在损失函数中为少数类样本分配更高的分类错误惩罚权重。
尝试使用 SMOTE (Synthetic Minority Over-sampling Technique) 算法在训练集中生成合成的少数类样本。

这道题你会答吗?花几分钟告诉大家答案吧!