[PYTHON] [Praktisch für Anfänger] Lesen Sie zaggles "Vorhersage der Eigenheimpreise" Zeile für Zeile (8. Erstellen eines Vorhersagemodells)
Thema
Das 8. Projekt, um den Inhalt der praktischen Übungen zu notieren, bei denen jeder das berühmte Thema "Hauspreis" von Kaggle in Frage stellen wird. Es ist eher ein Memo als ein Kommentar, aber ich hoffe, es hilft jemandem irgendwo. Die Vorbereitungen wurden letztes Mal abgeschlossen, und ich bin in einem Zustand wiederholter Überlegungen und sage, dass ich in der Analysephase mehr Statistiken hätte studieren sollen.
- Ursprüngliches Thema: https://www.kaggle.com/c/house-prices-advanced-regression-techniques
- Referenzierter Artikel: https://yolo-kiyoshi.com/2018/12/17/post-1003/
Die heutige Arbeit
Erstellen eines Vorhersagemodells
StandardScaler () #scaling
Lesen Sie vorerst den folgenden Artikel. Und heute werde ich meine Eindrücke schreiben.
- Informationen zur Skalenkonvertierung: https://aizine.ai/preprocessing0614/
Was ich fand:
- Passt die möglichen Werte und den Bereich des Feature-Betrags an und konvertiert ihn so, dass er in denselben Bereich passt.
- Beispiel) Wenn "Anzahl der Besucher" und "Temperatur" als "Merkmale, die für den Verkauf wirksam sind" festgelegt sind, ist der Unterschied für "Anzahl der Besucher" einfach größer, und die Beurteilung der Wichtigkeit folgt nicht der tatsächlichen Messung. beeinflussen.
- Es gibt verschiedene Methoden zur Skalenkonvertierung. Von den im Artikel beschriebenen Inhalten wird häufig derjenige verwendet, den ich dieses Mal verwende (?) "Standard Scaler-Konvertierung"
Lasso-Regressionsmodell
Ich werde vorerst die folgenden Artikel lesen und meine Eindrücke heute (zum zweiten Mal) schreiben.
- Lasso-Regressionsmodell: https://aizine.ai/ridge-lasso-elasticnet/
- Verwandtes Wort "Lineare Regression": https://aizine.ai/glossary-liner-regression/
- Verwandte Wörter "Overlearning": https://aizine.ai/overfitting0206/
- Zugehöriges Wort "Kostenfunktion / mittlerer quadratischer Fehler": https://aizine.ai/glossary-mse/
Was ich fand:
- Da es sich diesmal um Eigenschaftsinformationen handelt und es viele erklärende Variablen gibt, wird die Lasso-Regression übernommen.
Pipelinebau
- Lesen Sie vorerst den folgenden Artikel. Und heute werde ich meine Eindrücke schreiben. (3. Mal) *
- Informationen zur Pipeline: https://qiita.com/colako/items/b4f4159b77c0a87e978f
Was ich fand:
- Es werden verschiedene Abläufe wie Skalierung und Klassengenerierung erstellt. (Dies ist der Satz, den ich vollständig verstehen möchte ...)
Das ist es.
Heute habe ich angefangen zu lesen, ohne Code zu schreiben, aber es ist wichtig, den Hintergrund zu kennen, oder wenn ich es nach dieser praktischen Übung systematisch mache, denke ich, dass es wahr sein wird.