首页 > 试题广场 >

缺失值有哪几种类型?一般缺失值有哪些处理方法?

[问答题]

缺失值有哪几种类型?一般缺失值有哪些处理方法?

类型:完全随机缺失,随机缺失,非随机缺失
处理方法:
1.直接删除含有缺失值的数据,由于数据收集不易,如果不是该条数据缺失很多特征,一般不采取这种方式
2.填充缺失值:
(1) 总体均值填充(仅适用于连续型变量)
(2) 同类均值填充(仅适用于连续型变量)
(3) 总体中值填充(仅适用于连续型变量)
(4) 同类中值填充(仅适用于连续型变量)
(5) 众数填充
(6) 指定值填充
(7) 总体随机值填充
(8) 同类随机值填充
(9) 通过模型进行预测:选择几个相关变量,以目标变量为label建立模型进行监督学习,然后用模型预测缺失
发表于 2021-01-13 20:55:48 回复(0)
类型:完全随机缺失,随机缺失,非随机缺失
处理方法:
  1. 删除含有缺失值的个案
  2. 可能值插补缺失值

    (1)均值插补

    (2)利用同类均值插补。

    (3)极大似然估计(Max Likelihood ,ML)

    (4)多重插补(Multiple Imputation,MI)

发表于 2019-10-17 19:18:44 回复(0)