马氏距离

Mahalanobis Distance

Definition

条件:

  • 对于两个服从同分布的样本点,它们的特征向量为${x,y}$
  • 分布的均值向量为$\mu$
  • 协方差矩阵为$\Sigma$可逆

Trait

  • 尺度无关:不同特征的量纲和大小不会影响马氏距离的计算。
  • 考虑特征的相关性:如果特征之间存在相关性,可以通过协方差矩阵来调整特征间的”权重”。
  • 分布敏感:马氏距离适合于服从多元正态分布的数据

Description

  • Mahalanobis Distance常用于异常检测、分类和聚类等领域。
  • 由于它可以有效地衡量样本间的相似性,特别是在特征空间中,样本点不是均匀分布时,马氏距离相比于其他距离度量方法更加有效。
  • 在使用马氏距离时需要注意协方差矩阵必须是非奇异的(也就是可逆的),否则不能计算逆矩阵。