Neulich haben wir ein internes Training zum Titanic-Wettbewerb von Kaggle abgehalten. Wir werden die Erklärungsmaterialien und die Übungen, die die Teilnehmer gemacht haben, teilen. Die Materialien und Ausgaben befinden sich in Kaggles Notizbuch. Wenn Sie interessiert sind, überprüfen Sie dies bitte ebenfalls.
Dies ist übrigens Qiitas erster Beitrag.
Da es nicht möglich ist, alles allein durch Training zu lehren (zu lernen), hielt ich es für notwendig, dass jeder Einzelne weiter daran arbeitet. Wenn ich versuchte, etwas zu lernen, stolperte ich manchmal über die Konstruktion der Umgebung, deshalb entschied ich mich für Kaggle, was es unnötig macht.
Da ich Kaggle benutze, habe ich das Erklärungsmaterial auch als Kaggles Notizbuch erstellt.
Erklärendes Material: Probieren wir das Kaggle-Tutorial "Titanic Survivor Prediction" aus! https://www.kaggle.com/plasticgrammer/kaggle-titanic
Übungsaufgabe: Titanic: Überlebende vorhersagen (ΦωΦ) https://www.kaggle.com/plasticgrammer/titanic-predict-survivors
Ich wollte Erklärungen und Übungen ausgewogen kombinieren, also fuhr ich mit dem folgenden Ablauf fort.
Datenanalyseübungen
Erklären Sie die Prognose anhand von Materialien
Der folgende Inhalt wird auch im Übungsheft beschrieben, aber ich werde ihn vorerst auch in diesem Artikel beschreiben.
--Überprüfen Sie die Anzahl der Zeilen und Spalten der Trainingsdaten und Testdaten
-Lass uns die Anzahl der Variablen Geschlecht in [Für jeden Überlebenden] mit einem Balkendiagramm überprüfen Gibt es eine Korrelation? Wenn ja, welche Trends gibt es? -Lass uns die Anzahl der Variablen Pclass von [For each Survived] mit einem Balkendiagramm überprüfen Gibt es eine Korrelation? Wenn ja, welche Trends gibt es?
Annahme) Alter (gefüllt mit 0 fehlenden Werten), Fluss zur Vorhersage mit Random Forest unter Verwendung von Geschlecht wurde erstellt
Dieses Training dauerte 5 Stunden. Es dauerte länger als erwartet, mit der letzten Aufgabe fortzufahren, um die Vorhersagegenauigkeit zu verbessern. Als Ergebnis hatte ich den Eindruck, dass es schwierig war. Später führte ich es erneut in Form eines zusätzlichen Trainings durch, aber ich hatte das Gefühl, dass es besser wäre, eins nach dem anderen mit vielen Übungen fortzufahren.
Es gibt viele Artikel über den Titanic-Wettbewerb, auf die ich auf verschiedene Weise Bezug genommen habe. Wenn ich versucht habe, es zu einer Trainingsaufgabe für Python-Anfänger zu machen, habe ich es oft als Material zusammengestellt, also habe ich es mit Ihnen geteilt, wenn es hilft.
Recommended Posts