[PYTHON] Überprüfen Sie, ob die erwartete Spalte in Pandas DataFrame vorhanden ist

Angenommen, es gibt die folgende "Funktion, die DataFrame verarbeitet".

import pandas as pd

def preprocess(df: pd.DataFrame) -> pd.DataFrame:
    df["full_name"] = df["first_name"] + " " + df["last_name"]
    return df

Es wird erwartet, dass das DataFrame-Argument für diese Funktion die Spalten "Vorname" und "Nachname" enthält. Möglicherweise möchten Sie dies jedoch am Anfang der Funktion überprüfen.

Dies kann einfach mit der Operation set type [^ set] geschrieben werden.

import pandas as pd

def preprocess(df: pd.DataFrame) -> pd.DataFrame:
    required_columns = {"first_name", "last_name"}
    if not required_columns <= set(df.columns):
        raise ValueError(f"missing columns: {required_columns - set(df.columns)}")
    df["full_name"] = df["first_name"] + " " + df["last_name"]
    return df

Wenn Sie es so schreiben, wird ein ValueError ausgelöst, wenn die erforderliche Spalte fehlt.

df = pd.DataFrame([{"first_name": "John", "age": 30}])  # 'last_name'DataFrame mit fehlenden Spalten
preprocess(df)  #=> ValueError: missing columns: {'last_name'}

Recommended Posts

Überprüfen Sie, ob die erwartete Spalte in Pandas DataFrame vorhanden ist
Überprüfen Sie, ob die URL in Python vorhanden ist
[Pandas] Wenn sich die Daten der ersten Zeile im Header von DataFrame befinden
Gibt es NaN im Pandas DataFrame?
Überprüfen Sie, ob die Zeichen in Python ähnlich sind
In Bash "Löschen Sie die Datei, falls vorhanden".
Überprüfen Sie, ob die Zeichenfolge eine Zahl in Python ist
Überprüfen Sie, ob es sich um Unix in der Skriptsprache handelt
Kombinieren Sie Listen zu einem DataFrame mit Pandas
Praktische Funktion zum Hinzufügen von Spalten an einer beliebigen Stelle in Pandas DataFrame
So überprüfen Sie, ob ein Wert in einem Aufzählungstyp vorhanden ist
python / pandas / dataframe / So erhalten Sie die einfachste Zeile / Spalte / Index / Spalte
Überprüfen Sie, ob die Einstellungsdatei leicht verständlich gelesen wird
Überprüfen Sie, ob der von PHP generierte Passwort-Hash in Python übereinstimmt
Überprüfen Sie die Datenzusammenfassung in CASTable
Ich möchte die zweite Zeile zum Spaltennamen in Pandas machen
Durchsuchen Sie .loc und .iloc gleichzeitig in pandas DataFrame
[Golang] Überprüfen Sie, ob eine bestimmte Zeichenfolge in der Zeichenfolge enthalten ist
So erhalten Sie mit pandas DataFrame einen bestimmten Spaltennamen und Indexnamen
Wenn in boto3 der Fehler no attribute angezeigt wird, überprüfen Sie die Version
Überprüfen Sie das Verhalten des Zerstörers in Python
Aktualisieren Sie Pandas DataFrame-Elemente nach Spaltennamen
Holen Sie sich die besten n-ten Werte in Pandas
So weisen Sie den Index im Pandas-Datenrahmen neu zu
[Pandas] Erweitern Sie die Zeichenfolgen zu DataFrame
Ersetzen Sie Spaltennamen / -werte durch Pandas-Datenrahmen
12. Speichern Sie die erste Spalte in col1.txt und die zweite Spalte in col2.txt
Löschen Sie Zeilen mit beliebigen Werten in pandas DataFrame
Feststellen, ob das Bild Vögel enthält
[Python] Sortieren Sie die Tabelle nach sort_values (pandas DataFrame)
Entfernen Sie Zeilen mit doppelten Indizes in pandas DataFrame
Python-Ordner erstellen Überprüfen Sie, ob er bereits vorhanden ist
Speichern Sie Pandas DataFrame als .csv.gz in Amazon S3
So überprüfen Sie in Python, ob sich eines der Elemente einer Liste in einer anderen Liste befindet