首页 > 试题广场 >

对于数据: {12 , 9 , 7 , 6 , 20 , 1

[问答题]

对于数据: {12 9 7 6 20 100 35 21 11 18 25 37}

1) 计算它的平均值, 20% 的截断均值和中位数,并说明这三个统计特征在描述数据集方面的特点。
2 ) 使用 MIN-MAX 规范方法将值其中的 6,100,35 转换到 [0,1]
3)   对数据按照 深度为 4 进行划分,再写出按边界值进行平滑后的结果。解释一下一般会因为什么目的对数据进行平滑处理。
<1>均值为:(12 +9 + 7+6+20+100+35+21+11 +18 +25 +37/12=25.08
20% 的截断均值12x20%=2.4~2(两端各去掉1个数以后的平均值)(7+9+11+12+18+20+21+25+35+37)/10=19.5
中位数是 (18+20)/2=19

 <2>6,100,35规范化后,新数据=(原数据-最小值)/(最大值-最小值) 
(6-6)/(100-6)=0;
(100-6)/(100-6)=1;
(35-6)/(100-6)=0.30851~0.31,
转换后的值为( 0  1  0.31 

<3>深度为 4 进行划分,得到三个箱  6,7  9  11 ),( 12  18  20  21),( 25  35  37  100 
按边界值平滑 :用距离较小的边界值替代箱中每一数据。
|7-6|=1,|11-7|=4, 故6作为平滑边界值
|9-6|=3,  |11-9|=2故11作为平滑边界值
|18-12|=6,|21-18|=3,故21作为平滑边界值
|20-12|=8,|21-20|=1,故21作为平滑边界值
|35-25|=10,|100-35|=65,故25作为平滑边界值
|37-25|=12,|100-37|=63,故25作为平滑边界值
边界值平滑后的结果为  6  6 ,11 11 ),( 12  21  21  21 ),( 25 25  25  100 


发表于 2019-07-01 10:08:26 回复(0)

1) 答案:平均值是 25.08 20% 的截断均值(两端各去掉两个数以后的平均值)是 18.8 ,,中位数是 19

2 )规范化后,转换后的值为( 0 1 0.31

3 )深度为 4 进行划分,得到三个箱 6 7 9 11 ),( 12 18 20 21 ),( 25 35 37 100

边界值平滑后的结果为 6 6 11 11 ),( 12 12 21 21 ),( 25 25 25 100

发表于 2017-05-07 12:24:47 回复(4)