首页 > 试题广场 >

假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录 p

[问答题]
假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录 p , q 和 C1 , C2 的信息如下,分别求出记录和簇彼此之间的距离。 
p={ 男,广州, 18} 
q={ 女,韶关, 20} 
C1={ 男: 25 ,女: 5 ;广州: 20 ,深圳: 6 ,韶关: 4 ; 20} 
C2={ 男: 3 ,女: 12 ;汕头: 12 ,深圳: 1 ,韶关: 2 ; 24}
发表于 2017-05-19 17:05:55 回复(0)
属性值相同的距离为0,不同的距离为1。例:男到男的距离为0,男到女的距离为1。
(可以计算距离为1的比例之和,也可以使用1-距离为0的比例,为了方便理解,下解计算距离为1的比例之和)
解:(使用曼哈顿距离)
d(p,q) = 1+1+2=4
d(p,c1) = 1*5/30 + 1*(6/30 + 4/30) + 2 = 2.5
d(p,c2) = 1*12/15 + 1*15/15 + 6 = 7.8
d(q,c1) = 1*25/30 + 1*(20/30 + 6/30) + 0 =  1.7
d(q,c2) = 1*3/15 + 1*(12/15 + 1/15) + 4 = 5.067
d(c1,c2) = ((25/30 * 12/15) + (5/30 * 3/15)) + ((20/30 * 12/15) + (20/30 * 1/15) + (20/30 * 2/15) + (6/30 *12/15) + (6/30 * 2/15) + (4/30 * 12/15) + (4/30 * 1/15)) + 4 = 5.668
发表于 2017-07-26 22:12:08 回复(0)

答: d p q =1+1+ 20-18 =4

d p C1 = 1-25/30 + 1-20/30 + 20-18 =2.5

d p C2 = 1-3/15 + 1-0/15 + 24-18 =7.8

d q C1 = 1-5/30 + 1-4/30 + 20-20 =1.7

d q C2 = 1-12/15 + 1-2/15 + 24-20 =5.07

d C1 C1 = 1- 25*3+5*12 /30*15
+ 1- 6*1+4*2 /15*30 + 24-20 =5.67

发表于 2017-05-06 10:23:09 回复(1)