[PYTHON] Comment trouver la distance de Maharanobis

Distance de Maharanobis

d=(x-\mu)^T\Sigma^{-1}(x-\mu)

$ x $ est le vecteur pour lequel vous voulez trouver la distance au groupe de données. $ \ Mu $ est la valeur moyenne du groupe de données. $ \ Sigma ^ {-1} $ est l'inverse de la matrice de covariance du groupe de données. En utilisant la décomposition choleskey, l'équation peut être transformée comme suit.

\begin{eqnarray}
d &=& (x-\mu)^T\Sigma^{-1}(x-\mu) \\
  &=& (x-\mu)^T(LL^T)^{-1}(x-\mu) \\
  &=& (L^{-1}(x-\mu))^T(L^{-1}(x-\mu)) \\
  &=& z^Tz
\end{eqnarray}

$ L $ est la matrice triangulaire inférieure obtenue par la décomposition choleskey. Si vous définissez $ z = (L ^ {-1} (x- \ mu)) $ et trouvez ceci, tout ce que vous avez à faire est de calculer le produit interne.

la mise en oeuvre

Implémentez ce qui précède en python.

import numpy as np
from scipy.linalg import solve_triangular

def mahalanobis(x, mu, sigma):
    L = np.linalg.cholesky(sigma)
    d = x - mu
    z = solve_triangular(
        L, d.T, lower=True, check_finite=False,
        overwrite_b=True)
    squared_maha = np.sum(z * z, axis=0)
    return squared_maha

$ L $ se trouve dans linalg.cholesky de numpy. $ z $ se trouve dans linalg.solve_triangular de scipy.

référence

https://github.com/ZQPei/deep_sort_pytorch/blob/master/deep_sort/sort/kalman_filter.py
https://blogs.sas.com/content/iml/2012/02/15/what-is-mahalanobis-distance.html
https://stackoverflow.com/questions/11785201/mahalanobis-distance-inverting-the-covariance-matrix