Erstellen Sie ein Überlebensvorhersagemodell für Passagiere der Kaggle Titanic, ohne Python zu verwenden

Zusammenfassung und Ergebnisse dieses Artikels

Ich werde den Kaggle Titanic-Wettbewerb mit der kürzlich erlernten AutoML VARISTA herausfordern. Die Punktzahl betrug 0,80861.

Registrieren Sie sich bei Kaggle

Wenn Sie nicht bei Kaggle registriert sind, registrieren Sie sich bitte bei Kaggle. Bitte registrieren Sie sich oben rechts auf dem Bildschirm. image.png

Vorbereitung der Daten

Dieser Wettbewerb ist "Titanic: Maschinelles Lernen aus Katastrophen" von hier. Gehen Sie zum Wettbewerb und wählen Sie die Registerkarte "Daten". Sie können die Datenseite auch aufrufen, indem Sie auf [hier] klicken (https://www.kaggle.com/c/titanic/data). Wenn Sie den Datenbildschirm erreichen, wählen Sie Alle herunterladen. image.png

Wenn der Download abgeschlossen ist, finden Sie "titanic.zip". Entpacken Sie diese Datei. Nach dem Entpacken sehen Sie die folgenden Dateien.

image.png

Die Verwendung jeder Datei ist wie folgt.

Dateiname Verwenden
train.csv Lehrerdaten
test.csv Testdaten
gender_submission.csv Beispieldaten für die Buchung

** Beschreibung der Datenvariablen **

Spaltenname japanisch
PassengerID Passagierausweis
Survived Überlebensergebnis(1:Überleben, 0:Tod)
Pclass Raumklasse 1=Upper, 2=Middle, 3=Lower
Name Name
Sex Sex
Age Alter
SibSp Anzahl der Brüder und Ehepartner
Parch Anzahl der Eltern und Kinder
Ticket Ticketnummer
Fare Boarding Gebühr
Cabin Zimmernummer
Embarked Drei Arten von Häfen an Bord: Cherbourg, Queenstown und Southampton

Registrieren Sie sich bei VARISTA

Erstellen Sie ein VARISTA-Konto. Gehen Sie zu http://www.varista.ai und registrieren Sie sich von der oberen Seite. Wenn Sie sich von diesem Konto aus registrieren, handelt es sich übrigens um ein Guthaben, das für den Dienst verwendet werden kann. Wenn Sie nichts dagegen haben, würde ich mich freuen, wenn Sie über diesen Link fliegen könnten. .. Wenn es dir nicht gefällt, kannst du überhaupt von ↑ fliegen. .. Ich wusste es nicht··. https://console.varista.ai/welcome/jamaica-draft-coach-cup-blend

Es scheint einen bezahlten Plan zu geben, aber vorerst habe ich ihn kostenlos ausprobiert.

image.png

Projekterstellung und Datenbestätigung

Erstellen Sie nach der Anmeldung bei VARISTA einen Arbeitsbereich mit einem beliebigen Namen. Erstellen Sie nach dem Erstellen des Arbeitsbereichs das Projekt. Ich denke, der Name könnte Titanic sein.

Folgen Sie der Anleitung, um die Daten hochzuladen. スクリーンショット 2020-05-26 23.02.41.png

Die hochzuladenden Daten sind die Lehrerdaten "train.csv". スクリーンショット 2020-05-26 23.03.29.png

Wenn der Upload abgeschlossen ist, wählen Sie die Spalte aus, die Sie vorhersagen möchten. In diesem Wettbewerb möchte ich das Überleben der Passagiere vorhersagen, daher werde ich "Überlebt" auswählen. スクリーンショット 2020-05-26 23.04.14.png

Wählen Sie START, für das die Einstellungen abgeschlossen wurden, um zum nächsten Bildschirm zu gelangen. スクリーンショット 2020-05-26 23.04.38.png

Sobald Sie Ihr Ziel ausgewählt haben, können Sie loslegen.

Bestätigung der Daten

Sie können hier plötzlich anfangen zu lernen, aber da es eine große Sache ist, schauen wir uns den Inhalt der Daten an. Wählen Sie das Datenmenü und wählen Sie die zuvor hochgeladene "train.csv". スクリーンショット 2020-05-26 23.11.40.png

Wenn Sie sich die Datenmängel ansehen, können Sie feststellen, dass die Alters- und Kabinendaten Mängel aufweisen. Im Fall von VARISTA scheinen fehlende Daten jedoch automatisch ergänzt zu werden.

image.png

Schauen wir uns die Verteilung der Daten an. Wenn Sie auf der Registerkarte "Visualisieren" auswählen, wird die Verteilung für alle Daten in der Feature-Spalte angezeigt. Dies ist praktisch. Wenn Sie die Registerkarte Korrelation auswählen, können Sie die Korrelation zwischen den Spalten, die Sie vorhersagen möchten, und jeder Spalte anzeigen.

スクリーンショット 2020-05-26 23.53.13.png

** Geschlecht, Alter ** Versuchen Sie, 0 durch Tod und 1 durch Überleben zu ersetzen. Das Geschlecht hat viel damit zu tun, und Frauen scheinen am Leben zu sein. Was das Alter betrifft, so ist die Überlebensrate unter 7 Jahren im Allgemeinen hoch, und die Sterblichkeitsrate scheint nach 60 Jahren hoch zu sein. Es scheint keinen großen Unterschied in der Mitte zu geben. Das Kind scheint bevorzugt gerettet worden zu sein image.png

PClass Je höher der Grad, desto höher die Überlebensrate. image.png

Lernen

Lass uns tatsächlich lernen. Wählen Sie links das KI-Modell aus und klicken Sie auf "KI-Modell erstellen". Stellen Sie als Nächstes sicher, dass die Spalte, die Sie vorhersagen möchten, "Überlebt" ist, und klicken Sie auf die Schaltfläche "Lernen starten". スクリーンショット 2020-05-26 23.05.21.png

Das Lernen beginnt automatisch ohne Einstellungen, insbesondere auf dieser Seite, die heutzutage sehr beliebt ist. Es scheint, dass Feature Quantity Engineering durchgeführt wird und das Lernen mit mehreren Algorithmen erfolgt.

Lernergebnis

Es hat eine Punktzahl von 70. Betrachtet man den Grad des Einflusses, so scheint es, dass Geschlecht und Klasse mit dem Überleben zusammenhängen. スクリーンショット 2020-06-03 21.39.23.png

Einreichung bei Kaggle

Klicken Sie auf dem Bildschirm ↑ auf ** Mit diesem Modell vorhersagen **. Klicken Sie hier, um das Ausgabeformat zu ändern. image.png

Legen Sie die Spalten fest, die nicht ausgegeben werden. スクリーンショット 2020-05-28 8.51.57.png

Ändern Sie dann das Format der Ausgabespalten in Flags. スクリーンショット 2020-05-28 8.52.18.png

Ziehen Sie abschließend test.csv aus der zuvor heruntergeladenen Datei und legen Sie sie dort ab. image.png

Laden Sie die fertige Datei herunter. image.png

Wenn Sie die Datei öffnen, sehen Sie, dass die Spalte ganz rechts die Vorhersage des Überlebens enthält. Es gibt Spalten, die nicht zum Posten in Kaggle benötigt werden. Löschen Sie sie daher. Dieses Mal habe ich es mit Numbers auf dem Mac entfernt, aber ich denke, Excel usw. ist gut für Windows. スクリーンショット 2020-06-03 21.20.22.png

Wählen Sie im Kaggle-Wettbewerbsbildschirm "Vorhersagen senden" und ziehen Sie die zuvor heruntergeladene Datei per Drag & Drop. スクリーンショット 2020-05-28 8.30.37.png

Zum Schluss drücken Sie Make Submission, um Beiträge zu veröffentlichen. Nach einer Weile wird es gewertet und das Ergebnis wird ausgegeben.

スクリーンショット 2020-06-03 21.17.46.png

Die Punktzahl betrug diesmal 0,77511.

Passen Sie das Modell an, indem Sie die Lerneinstellungen ändern

Ich habe das Lernniveau, das Verhältnis der Verifizierungsdaten, die Anzahl der Unterteilungen der Kreuzungsüberprüfung und den Wert des zufälligen Startwerts aus den Lerneinstellungen geändert und die Punktzahl verbessert, sodass ich sie veröffentlichen werde.

Klicken Sie oben rechts im Startbildschirm für das Modelllernen auf die Einstellungsschaltfläche. スクリーンショット 2020-06-03 8.09.21.png

Ich habe versucht, den Wert so zu machen. Ich habe es nicht so oft ausprobiert, daher gibt es möglicherweise bessere Einstellungen, aber ich werde es später versuchen.

image.png

image.png

Jetzt lernen wir noch einmal und unterwerfen uns erneut Kaggle.

スクリーンショット 2020-06-03 20.13.18.png

Die Punktzahl stieg auf 0,80861. Das Erlernen von Level 3 dauert ungefähr 30 Minuten, daher möchte ich verschiedene Dinge ausprobieren und mehr schreiben.

Recommended Posts

Erstellen Sie ein Überlebensvorhersagemodell für Passagiere der Kaggle Titanic, ohne Python zu verwenden
Lassen Sie uns ein Überlebensvorhersagemodell für Titanic-Passagiere einrichten
Erstellen Sie mit tkinter eine Python-GUI
Erstellen Sie ein Modell für Ihren Django-Zeitplan
Erstellen wir eine virtuelle Umgebung für Python
[Python] Erstellen Sie eine Stapelumgebung mit AWS-CDK
(Kaggle) Prognostizierte Überlebende der Titanic anhand eines Modells unter Verwendung von Entscheidungsbäumen und zufälligen Wäldern
Erstellen Sie in Python ein elliptisches Streudiagramm, ohne eine multivariate Normalverteilung zu verwenden
Erstellen Sie mit Minette für Python einen LINE BOT
Erstellen Sie eine Webmap mit Python und GDAL
Erstellen Sie in Python ein einfaches Momentum-Investmentmodell
Erstellen Sie eine MIDI-Datei in Python mit pretty_midi
Lassen Sie uns mit SWIG ein Modul für Python erstellen
[Python] Implementierung von Clustering mit einem gemischten Gaußschen Modell
Erstellen Sie mit Selenium einen Datenerfassungsbot in Python
[CRUD] [Django] Erstellen Sie eine CRUD-Site mit dem Python-Framework Django ~ 1 ~
[Python] 2 Erstellen Sie eine Risiko-Rendite-Karte für Ihr Asset-Portfolio
[Python] Generieren Sie ValueObject mit dem vollständigen Konstruktor mithilfe von Datenklassen
Erstellen Sie in Docker eine Ebene für AWS Lambda Python
[CRUD] [Django] Erstellen Sie eine CRUD-Site mit dem Python-Framework Django ~ 2 ~
Konstruktionsnotiz für eine maschinelle Lernumgebung von Python
[CRUD] [Django] Erstellen Sie eine CRUD-Site mit dem Python-Framework Django ~ 3 ~
[CRUD] [Django] Erstellen Sie eine CRUD-Site mit dem Python-Framework Django ~ 4 ~
[CRUD] [Django] Erstellen Sie eine CRUD-Site mit dem Python-Framework Django ~ 5 ~
Erstellen Sie ein Python-Modul
Erstellen Sie eine Python-Umgebung
Implementierung von VGG16 mit Keras, die ohne Verwendung eines trainierten Modells erstellt wurden
Erstellen wir eine Funktion für den parametrisierten Test mithilfe eines Rahmenobjekts
Erstellen Sie einen lokalen Bereich in Python, ohne den Namespace zu verschmutzen
Titanic-Überlebensprognose mit dem Workflow-Management-Tool Kedro für maschinelles Lernen
Erstellen Sie ein untergeordnetes Konto für die Verbindung mit Stripe in Python
[Python] Erstellen Sie eine Datums- und Zeitliste für einen bestimmten Zeitraum
Probieren Sie die ähnliche Suche von Image Search mit Python SDK [Search] aus.
[Django] Erstellen Sie ein Modell, das für Telefonnummer / Postleitzahl geeignet ist
Erstellen Sie einen Twitter-BOT mit dem GoogleAppEngine SDK für Python
Versuchen Sie, ein neuronales Netzwerk in Python aufzubauen, ohne eine Bibliothek zu verwenden
Erstellen Sie ein Python-Skript für Wake on LAN (Wake on LAN über NAT [5])
Erstellen einer virtuellen Umgebung für Python auf dem Mac [Sehr einfach]
[Python] Erstellen Sie mit Django einen Bildschirm für den HTTP-Statuscode 403/404/500
Erstellen Sie ein Wox-Plugin (Python)
Erstellen Sie eine Funktion in Python
Erstellen Sie ein Wörterbuch in Python
Python: Schiffsüberlebensvorhersage Teil 2
Python: Schiffsüberlebensvorhersage Teil 1
Erstellen Sie JIRA-Tickets mit Python
Erstellen Sie ein Python-Numpy-Array
Python: Schiffsüberlebensvorhersage Teil 3
[Für Kaggle-Anfänger] Titanic (LightGBM)
Erstellen Sie ein Verzeichnis mit Python
Wettbewerb mit VS-Code Erstellen Sie eine Python-Umgebung für Profis unter Windows
Erstellen Sie mit turicreate eine API, die Daten aus einem Modell zurückgibt
Erstellen Sie mit dem Serverless Framework eine lokale Entwicklungsumgebung für Lambda + Python
Erstellen Sie eine gestreifte Illusion mit Gammakorrektur für Python3 und openCV3
Erstellen Sie mit Python + Qt (PySide) einen Farbwähler für das Farbrad.
Versuchen Sie es mit virtualenv, mit dem eine virtuelle Umgebung von Python erstellt werden kann
Erstellen Sie einen einfachen geplanten Stapel mit Dockers Python Image und parse-crontab
[Ev3dev] Erstellen Sie ein Programm, das das LCD (Bildschirm) mit Python erfasst
Python vba zum Erstellen einer Datumszeichenfolge zum Erstellen eines Dateinamens