[PYTHON] Unterschied zwischen Numpy- und Pandas-Methoden zur Ermittlung der Verteilung

TL;DR

Ich verarbeite Numpy und Pandas verteilt und sie stimmen nicht überein. Warum also? Ich werde eine Notiz hinterlassen, weil es wurde.

Das Ergebnis der Methode zum Finden von var von numpy und pandas stimmt nicht mit dem Standardwert überein

Testen Sie mit einer einfachen, zufällig generierten Matrix. Es passt nicht wirklich zusammen.

import numpy as np
import pandas as pd

X = np.random.randn(10, 10)
df = pd.DataFrame(data=X)

np.allclose(X, df.values)
# True

X_var = np.var(X, axis=1)
df_var = df.var(axis=1)

np.allclose(X_var, df_var.values)
# False

Wenn ich die Dokumentation tatsächlich überprüfe, ist numpy.var standardmäßig "ddof = 0". , Pandas.DataFrame.var ist standardmäßig "ddof = 1" ..

Wenn Sie die Standardwerte ausrichten, stimmen die Ergebnisse überein.

X_var_ddof1 = np.var(X, ddof=1, axis=1)
df_var_ddof1 = df.var(axis=1)

np.allclose(X_var_ddof1, df_var_ddof1.values)
# True

Ich dachte, dass die Berechnungsergebnisse nicht übereinstimmen würden, aber tatsächlich gab es einen kleinen Unterschied zwischen Numpy und Pandas. Ich möchte, dass Sie es vereinheitlichen, aber ich werde ein Memo veröffentlichen, falls jemand davon abhängig ist.

Recommended Posts

Unterschied zwischen Numpy- und Pandas-Methoden zur Ermittlung der Verteilung
Unterschied zwischen Numpy 1D Array [x] und 2D Array [x, 1]
Um zwischen Standard-Python, Numpy, Pandas hin und her zu gehen ①
Leistungsvergleich zwischen zweidimensionaler Matrixberechnung und für mit Numpy
Unterschied zwischen Windows- und Linux-Verzeichnissen
Unterschied zwischen yum-Befehl und APT-Befehl
Unterschied zwischen Numpys Randint und Randoms Randint
Unterschied zwischen Python, Stftime und Strptime
Unterschied in der Authentizität zwischen Python und JavaScript
Unterschiede zwischen Python- und Java-Syntax
matplotlib Grundlagen / Unterschied zwischen Feigen und Achsen
Unterschiede in der Multithread-Verarbeitung zwischen Python und Jython
Unterschied zwischen Ruby und Python (grundlegende Syntax)
Unterschiede zwischen queryStringParameters und multiValueQueryStringParameters in AWS Lambda
Zusammenfassung der Unterschiede zwischen PHP und Python
Passen Sie die Schriftunterschiede zwischen Qt für Python OS an
Unterschiede und Gemeinsamkeiten zwischen Diktattyp, Listentyp und Tupeltyp