[PYTHON] Différence entre les méthodes numpy et pandas pour trouver une distribution

TL;DR

Je fais du traitement distribué de numpy et pandas, et ils ne correspondent pas, alors pourquoi? Je vais laisser un mot car c'est devenu.

Le résultat de la méthode de recherche de var de numpy et pandas ne correspond pas à la valeur par défaut

Testez avec une matrice simple, générée aléatoirement. Cela ne correspond pas vraiment.

import numpy as np
import pandas as pd

X = np.random.randn(10, 10)
df = pd.DataFrame(data=X)

np.allclose(X, df.values)
# True

X_var = np.var(X, axis=1)
df_var = df.var(axis=1)

np.allclose(X_var, df_var.values)
# False

Quand je vérifie réellement la documentation, numpy.var est par défaut «ddof = 0». , Pandas.DataFrame.var vaut par défaut ddof = 1 ..

Si vous alignez les valeurs par défaut, les résultats correspondent.

X_var_ddof1 = np.var(X, ddof=1, axis=1)
df_var_ddof1 = df.var(axis=1)

np.allclose(X_var_ddof1, df_var_ddof1.values)
# True

Je pensais que les résultats du calcul ne correspondraient pas, mais en fait, il y avait une légère différence entre numpy et pandas. J'aimerais que vous l'unifiez, mais je publierai un mémo au cas où quelqu'un en serait accro.

Recommended Posts

Différence entre les méthodes numpy et pandas pour trouver une distribution
Différence entre le tableau Numpy 1D [x] et le tableau 2D [x, 1]
Pour aller et venir entre python standard, numpy, pandas ①
Comparaison des performances entre le calcul matriciel bidimensionnel et pour avec numpy
Différence entre les répertoires Windows et Linux
Différence entre la commande yum et la commande APT
Différence entre le randint de Numpy et le randint de Random
Différence entre Python, stftime et strptime
Différence d'authenticité entre Python et JavaScript
Différences entre la syntaxe Python et Java
Matplotlib Basics / Différence entre fig et axes
Différences de multithreading entre Python et Jython
Différence entre Ruby et Python (syntaxe de base)
Différences entre queryStringParameters et multiValueQueryStringParameters dans AWS Lambda
Résumé des différences entre PHP et Python
Ajuster les différences de police entre Qt pour Python OS
Différences et points communs entre le type de dict, le type de liste et le type de tuple