马氏距离
Mahalanobis Distance
Definition
条件:
- 对于两个服从同分布的样本点,它们的特征向量为${x,y}$
- 分布的均值向量为$\mu$
- 协方差矩阵为$\Sigma$可逆
Trait
- 尺度无关:不同特征的量纲和大小不会影响马氏距离的计算。
- 考虑特征的相关性:如果特征之间存在相关性,可以通过协方差矩阵来调整特征间的”权重”。
- 分布敏感:马氏距离适合于服从多元正态分布的数据
Description
- Mahalanobis Distance常用于异常检测、分类和聚类等领域。
- 由于它可以有效地衡量样本间的相似性,特别是在特征空间中,样本点不是均匀分布时,马氏距离相比于其他距离度量方法更加有效。
- 在使用马氏距离时需要注意协方差矩阵必须是非奇异的(也就是可逆的),否则不能计算逆矩阵。