首页 > 试题广场 >

训练数据不平衡是深度学习项目中的常见现象,数据不平衡问题会带

[问答题]
训练数据不平衡是深度学习项目中的常见现象,数据不平衡问题会带来什么问题,有哪些常用的解决办法?
由于通常情况下模型的损失函数对所有样本“一视同仁”(总损失由各个样本的损失求平均得到,所有样本的权重其实是相同的)。因此,数据不平衡会使得模型在少数类样本上毫无泛化性,或完全被多数类样本压制,完全学不到少数类样本的特点。因为即使模型只能识别多数类,也能使得总损失很低,而模型训练的过程仅仅是降低总损失。我们通常可以从数据层面、模型层面和任务类型来解决数据不平衡问题,如下图所示:
编辑于 2021-12-07 11:26:57 回复(0)
1、代价敏感加权:对少数样本进行加权
2、少数样本过采样smote
3、半监督学习
发表于 2022-09-08 15:08:07 回复(0)