Dies ist das vierte Mal in einem Projekt, in dem der Inhalt von Hands-on notiert wird, bei dem jeder das berühmte Thema "Hauspreis" von Kaggle in Frage stellt. Es ist eher ein Memo als ein Kommentar, aber ich hoffe, es hilft jemandem irgendwo. Der Eindruck, dass es sich allmählich ansammelte, als es das 4. Mal war.
Was ich bis zum letzten Mal getan habe, war das, das "den Index einschließlich des fehlenden Werts als Array erhält". (Apropos, ich fühle mich verwirrt, dass "Python verschiedene Konzepte von Arrays hat und es nervt.")
#Ergänzen Sie fehlende Werte nach Datentyp
#0 für float
#Im Falle eines Objekts'NA'
na_float_cols = alldata[na_col_list].dtypes[alldata[na_col_list].dtypes=='float64'].index.tolist() #float64
na_obj_cols = alldata[na_col_list].dtypes[alldata[na_col_list].dtypes=='object'].index.tolist() #object
#Ersetzen Sie 0, wenn der Typ float64 fehlt
for na_float_col in na_float_cols:
alldata.loc[alldata[na_float_col].isnull(),na_float_col] = 0.0
#Wenn der Objekttyp fehlt'NA'Ersatz
for na_obj_col in na_obj_cols:
alldata.loc[alldata[na_obj_col].isnull(),na_obj_col] = 'NA'
alldata[na_col_list].dtypes[alldata[na_col_list].dtypes=='float64'].index.tolist()
alldata[na_col_list].dtypes[alldata[na_col_list].dtypes=='object'].index.tolist()
for na_float_col in na_float_cols:
alldata.loc[alldata[na_float_col].isnull(),na_float_col] = 0.0
Ich werde vorerst darüber lesen. Die Reihenfolge der Variablen und Objekte ist umgekehrt zu der in PHP geschriebenen (ich weiß nicht, ob es korrekt ist).
Versuchen Sie, "na_float_col" und "alldata [na_float_col]" auszugeben. Das erste, was zu betrachten ist, ist die Eisenplatte zur Überprüfung der Funktionsweise des iterativen Prozesses.
Zum ersten Mal von na_float_col
Sie können den Namen "Index mit fehlenden Werten" sehen.
Zum ersten Mal von alldata [na_float_col]
Sie sehen ein Array mit Werten für "Index mit fehlenden Werten".
Ergebnis von .isnull () Wir verwenden "isnull ()", um festzustellen, ob jeder Wert null ist. Geben Sie "alldata [na_float_col] .isnull ()" aus
alldata.loc[alldata[na_float_col].isnull(),na_float_col]
alldata.loc [alldata [na_float_col] .isnull (), na_float_col]
Geben Sie in einer Matrix an und geben Sie "0.0" nur für fehlende Werte ein.
alldata.loc[alldata[na_float_col].isnull(),na_float_col] = 0.0
Jedes Element ist zu detailliert, um es zu sehen, aber Sie sollten in der Lage sein, dies zu tun.
Ausgabeergebnis von alldata
Ich dachte, ich würde es tun, aber die Zeit ist abgelaufen, deshalb möchte ich es als Vorbereitung für "Dummy-kategoriale Variablen" beenden. Ist es so, als würde man es quantifizieren, damit es analysiert werden kann? .. .. ??
Es dauerte länger als erwartet, um die fehlenden Werte zu vervollständigen. Ich frage mich, ob dies eine Python-Falle ist, die alles in einer Zeile zusammenfasst (ich hoffe, es wird keine Falle oder so, wenn ich mich daran gewöhne).
Es ist fast Zeit für die eigentliche Behandlung und ich freue mich darauf, die Kleidung zu riechen, die ich trage.
Recommended Posts