首页 > 试题广场 >

以下哪个距离修正了欧式距离中各个维度尺度不一致且相关的问题(

[单选题]
以下哪个距离修正了欧式距离中各个维度尺度不一致且相关的问题()
  • 切比雪夫距离
  • 马氏距离
  • 汉明距离
  • 曼哈顿距离
答案是 B 马氏距离,它专门用于修正欧式距离中维度尺度不一致和维度相关的问题。
要理解这一点,需要先明确各选项距离的核心特点,以及欧式距离的局限性:欧式距离直接计算各维度差值的平方和开根号,会因维度单位(如身高用厘米、体重用千克)和维度间关联(如身高与体重正相关)导致结果偏差。

各选项距离特点分析

  1. A 切比雪夫距离
    计算各维度差值的最大值,公式为 \(d = \max(|x_1-y_1|, |x_2-y_2|, ..., |x_n-y_n|)\)
    它仅关注差异最大的维度,既不处理尺度不一致,也不解决维度相关问题,常见于 “最不利情况” 分析(如棋盘上国王的最短步数)。
  2. B 马氏距离
    核心是引入协方差矩阵,公式为 \(d = \sqrt{(X-Y)^T \Sigma^{-1} (X-Y)}\)(其中 \(\Sigma\) 是维度的协方差矩阵)。
    • 协方差矩阵的逆能消除维度相关:若两个维度正相关(如身高和体重),会通过矩阵运算降低其重复影响。
    • 同时能统一尺度:无需手动标准化(如将厘米、千克转为同一单位),矩阵会自动修正不同维度的尺度差异,完全解决欧式距离的两个核心问题。
  3. C 汉明距离
    仅用于离散分类数据(如字符串、二进制),计算两个样本中 “不同维度的数量”(如 “0110” 与 “0101” 的汉明距离为 2)。
    与连续数据的尺度、相关性无关,不适用该问题场景。
  4. D 曼哈顿距离
    计算各维度差值的绝对值之和,公式为 \(d = |x_1-y_1| + |x_2-y_2| + ... + |x_n-y_n|\)
    它本质是欧式距离的 “L1 范数” 版本,同样未处理维度尺度不一致和相关性,仅比欧式距离更关注 “ Manhattan 街区式” 的路径累加。
发表于 2025-10-16 11:03:18 回复(0)