[PYTHON] Herausforderungen des Titanic-Wettbewerbs für Kaggle-Anfänger

Neulich haben wir ein internes Training zum Titanic-Wettbewerb von Kaggle abgehalten. Wir werden die Erklärungsmaterialien und die Übungen, die die Teilnehmer gemacht haben, teilen. Die Materialien und Ausgaben befinden sich in Kaggles Notizbuch. Wenn Sie interessiert sind, überprüfen Sie dies bitte ebenfalls.

Dies ist übrigens Qiitas erster Beitrag.

Einführung

Warum ich mich für Kaggle entschieden habe

Da es nicht möglich ist, alles allein durch Training zu lehren (zu lernen), hielt ich es für notwendig, dass jeder Einzelne weiter daran arbeitet. Wenn ich versuchte, etwas zu lernen, stolperte ich manchmal über die Konstruktion der Umgebung, deshalb entschied ich mich für Kaggle, was es unnötig macht.

Angenommene Teilnehmer

Über das Training

Trainingsziele

Erklärende Materialien, Übungen

Da ich Kaggle benutze, habe ich das Erklärungsmaterial auch als Kaggles Notizbuch erstellt.

Wie geht es weiter?

Ich wollte Erklärungen und Übungen ausgewogen kombinieren, also fuhr ich mit dem folgenden Ablauf fort.

  1. Erklären Sie die Datenanalyse anhand von Materialien
  1. Datenanalyseübungen

  2. Erklären Sie die Prognose anhand von Materialien

  1. Herausforderungen zur Verbesserung der Vorhersagegenauigkeit

Vorbereitete Übungen

Der folgende Inhalt wird auch im Übungsheft beschrieben, aber ich werde ihn vorerst auch in diesem Artikel beschreiben.

Datenanalyse

Schritt 1) Überprüfen Sie den Umriss der Daten

--Überprüfen Sie die Anzahl der Zeilen und Spalten der Trainingsdaten und Testdaten

Schritt 2) Überprüfen Sie die Details der Daten

Schritt 3) Visualisieren Sie, ob eine Korrelation besteht

-Lass uns die Anzahl der Variablen Geschlecht in [Für jeden Überlebenden] mit einem Balkendiagramm überprüfen Gibt es eine Korrelation? Wenn ja, welche Trends gibt es? -Lass uns die Anzahl der Variablen Pclass von [For each Survived] mit einem Balkendiagramm überprüfen Gibt es eine Korrelation? Wenn ja, welche Trends gibt es?

Feature-Erstellung und Vorhersage

Annahme) Alter (gefüllt mit 0 fehlenden Werten), Fluss zur Vorhersage mit Random Forest unter Verwendung von Geschlecht wurde erstellt

Reflexion über den Rückblick

Dieses Training dauerte 5 Stunden. Es dauerte länger als erwartet, mit der letzten Aufgabe fortzufahren, um die Vorhersagegenauigkeit zu verbessern. Als Ergebnis hatte ich den Eindruck, dass es schwierig war. Später führte ich es erneut in Form eines zusätzlichen Trainings durch, aber ich hatte das Gefühl, dass es besser wäre, eins nach dem anderen mit vielen Übungen fortzufahren.

abschließend

Es gibt viele Artikel über den Titanic-Wettbewerb, auf die ich auf verschiedene Weise Bezug genommen habe. Wenn ich versucht habe, es zu einer Trainingsaufgabe für Python-Anfänger zu machen, habe ich es oft als Material zusammengestellt, also habe ich es mit Ihnen geteilt, wenn es hilft.

Recommended Posts

Herausforderungen des Titanic-Wettbewerbs für Kaggle-Anfänger
[Für Kaggle-Anfänger] Titanic (LightGBM)
[Kaggle für Super-Anfänger] Titanic (Logistic Return)
Annäherungserklärung für Anfänger, um in Kaggle Titanic_3 unter den besten 1,5% (0,83732) zu sein
Annäherungserklärung für Anfänger, um in Kaggle Titanic_1 unter den besten 1,5% (0,83732) zu sein
Annäherungserklärung für Anfänger, um in Kaggle Titanic_2 unter den besten 1,5% (0,83732) zu sein
Erster Kaggle (Kaggle ①)
[Für Anfänger] Kaggle-Übung (Merucari)
Es ist okay, über die Titanic zu stolpern! Einführung in die Kaggle-Strategie für Super-Anfänger
[Kaggle] Teilnahme am Melanomwettbewerb
Überprüfen Sie die Korrelation mit Kaggles Titanic (kaggle③)
Der schnellste Weg für Anfänger, um Python zu beherrschen
Fordern Sie die Kaggle Titanic heraus
Durchführen des TensorFlow MNIST für ML-Anfänger-Tutorials
Tag 66 [Einführung in Kaggle] Die einfachste Titanic-Vorhersage
Ich habe das MNIST-Tutorial von tensorflow für Anfänger ausprobiert.
Kaggle-Wettbewerbsprozess unter dem Gesichtspunkt des Punkteübergangs
[Für Anfänger] Installieren Sie das Paket in der Anaconda-Umgebung (Janome)
Untersuchen Sie die Parameter von RandomForestClassifier im Kaggle / Titanic-Tutorial
[Für Anfänger] Quantifizieren Sie die Ähnlichkeit von Sätzen mit TF-IDF
Kaggle Tutorial Titanic Know-how, um in den Top 2% zu sein
Schauen Sie sich das Kaggle / Titanic-Tutorial genauer an
Spacemacs-Einstellungen (für Anfänger)
Python Lehrbuch für Anfänger
Dikstra-Algorithmus für Anfänger
OpenCV für Python-Anfänger
■ Kaggle-Übung für Anfänger - Einführung von Python - von Google Colaboratory
Tipps für Python-Anfänger, um das Scikit-Image-Beispiel für sich selbst zu verwenden
[Python] Die größten Schwächen und Nachteile von Google Colaboratory [Für Anfänger]
[Für Anfänger] Ich habe versucht, die Tensorflow-Objekterkennungs-API zu verwenden