[PYTHON] Pandas mit fehlendem Wert

Dieses Mal werde ich einen Artikel über fehlende Werte schreiben.

Inhalt

・ Was ist ein fehlender Wert? ・ So überprüfen Sie fehlende Werte ・ Umgang mit fehlenden Werten

Was ist ein fehlender Wert?

Ein fehlender Wert bedeutet, dass der Wert der Daten nicht eingegeben wird. Beispielsweise enthalten die Tabellendaten keine bestimmten Zahlen wie Leerzeichen oder NULL. Wenn Werte fehlen, können die Daten nicht gut abgerufen werden. Selbst wenn sie in einem Diagramm dargestellt werden, werden sie verzerrt.

So überprüfen Sie fehlende Werte

Wie können also fehlende Werte gefunden werden? Mit Pythons Pandas ist es leicht zu finden. Hier werden wir CSV-Daten verwenden.

isnull Funktion

Bei Pandas gibt es eine Funktion, mit der Sie leicht herausfinden können, wo keine Daten vorhanden sind. Es ist " isnull () </ b>". Dies ist eine Funktion, die in jeder Spalte, in der keine Daten vorhanden sind, False und True anzeigt. Wenn es keinen Wert gibt, wird True angezeigt, und wenn dies der Fall ist, wird False angezeigt.

jede Funktion

Dann müssen Sie nicht alle Daten einzeln überprüfen. Wenn Sie überprüfen möchten, ob Werte fehlen, fügen Sie nach isnull () die Funktion " any () </ b>" hinzu. Es wird geprüft, ob in der Spalte Werte fehlen. Das Ausgabeergebnis wird für jede Spalte als Wahr, Falsch angezeigt. Wenn ein Wert fehlt, wird er als True angezeigt. Wenn dies nicht der Fall ist, wird er als False angezeigt.

Summenfunktion

Es wird verwendet, wenn Sie die Anzahl der fehlenden Werte wissen möchten. Wie bei jeder Funktion kann die Anzahl der Nullen ausgegeben werden, indem sie nach der isnull-Funktion hinzugefügt wird.

value_counts Funktion

Eine Funktion, die die Anzahl der Nummern in einer angegebenen Spalte überprüft. Beispielsweise können Sie ein Ausgabeergebnis erhalten, z. B. 10 Zahlen 0.

Umgang mit fehlenden Werten

Es macht keinen Sinn, nur nach fehlenden Werten zu suchen. Sie müssen ihn durch einen konkreten numerischen Wert ersetzen. Dies nennt man Interpolation.

Fillna-Funktion

Nun interpolieren wir die Zahlen bei Null in der Tabelle. Zu diesem Zeitpunkt wird die Funktion " fllna </ b>" verwendet. Diese Funktion ändert alles in der Tabelle, in der Nullen in Zahlen angezeigt werden. Sie können einen beliebigen Wert angeben und speichern, indem Sie im Argument einen numerischen Wert angeben. Wenn Sie fillna (0) verwenden, werden alle Nullen auf 0 interpoliert.

Dropna-Funktion

Wenn Sie eine Zeile mit null löschen möchten, anstatt sie durch eine konkrete Zahl zu ersetzen, verwenden Sie die Funktion " dropna </ b>". Genau genommen wird die entsprechende Zeile gelöscht, wenn eine Spalte null ist. Wenn Sie eine bestimmte Spalte verwenden möchten, geben Sie im Argument "subset =" ["Spaltenname"] "an.