杂项

分层抽样:
如果数据总体由不同类型的对象组成,且每种类型的对象数据差别较大,那么简单随机抽样不能充分代表不太频繁出现的对象类型。如果分析中需要所有类型的代表,则随机抽样方***有问题。分层抽样就是解决这种问题的抽样方法。
分层抽样会从预先指定的组开始抽样。
1.等个数抽样
2.等比例抽样

异常检测:
Tukey 's Test
基于四分位数计算出最小值和最大值的估计值,超过最小估计值和最大估计值的数为异常值。
下四分位数 Q1
上四分位数 Q3
最小估计值: Q1-k(Q3-Q1)
最大估计值: Q3+k(Q3-Q1)

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务