首页 > 试题广场 >

训练数据不平衡是深度学习项目中的常见现象，数据不平衡问题会带

[问答题]

训练数据不平衡是深度学习项目中的常见现象，数据不平衡问题会带来什么问题，有哪些常用的解决办法？

pein531头像

pein531

由于通常情况下模型的损失函数对所有样本“一视同仁”（总损失由各个样本的损失求平均得到，所有样本的权重其实是相同的）。因此，数据不平衡会使得模型在少数类样本上毫无泛化性，或完全被多数类样本压制，完全学不到少数类样本的特点。因为即使模型只能识别多数类，也能使得总损失很低，而模型训练的过程仅仅是降低总损失。我们通常可以从数据层面、模型层面和任务类型来解决数据不平衡问题，如下图所示：

编辑于 2021-12-07 11:26:57 回复(0)

天天都想吃榴莲头像

天天都想吃榴莲

1、代价敏感加权：对少数样本进行加权

2、少数样本过采样smote

3、半监督学习

发表于 2022-09-08 15:08:07 回复(0)

提交观点

问题信息

算法工程师腾讯音乐娱乐集团数据库工程师大数据开发工程师数据分析师

上传者：小小

难度：

2条回答 30收藏 1364浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K2座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号