首页 > 试题广场 >

你正在开发一个欺诈交易检测模型,数据集中正样本(欺诈)的比例

[单选题]
你正在开发一个欺诈交易检测模型,数据集中正样本(欺诈)的比例远低于1%。在这种极端类别不平衡的情况下,以下哪种做法是存在严重风险且最不被推荐的?
  • 使用精确率-召回率曲线(Precision-Recall Curve)或 F1-Score 作为主要的模型评估指标,而不是准确率(Accuracy)。
  • 在进行交叉验证(Cross-Validation)之前,先对整个数据集进行上采样(Oversampling),以平衡正负样本比例。
  • 采用代价敏感学习(Cost-Sensitive Learning),在损失函数中为少数类样本分配更高的分类错误惩罚权重。
  • 尝试使用 SMOTE (Synthetic Minority Over-sampling Technique) 算法在训练集中生成合成的少数类样本。

这道题你会答吗?花几分钟告诉大家答案吧!