Ich werde den Kaggle Titanic-Wettbewerb mit der kürzlich erlernten AutoML VARISTA herausfordern. Die Punktzahl betrug 0,80861.
Wenn Sie nicht bei Kaggle registriert sind, registrieren Sie sich bitte bei Kaggle. Bitte registrieren Sie sich oben rechts auf dem Bildschirm.
Dieser Wettbewerb ist "Titanic: Maschinelles Lernen aus Katastrophen" von hier. Gehen Sie zum Wettbewerb und wählen Sie die Registerkarte "Daten". Sie können die Datenseite auch aufrufen, indem Sie auf [hier] klicken (https://www.kaggle.com/c/titanic/data). Wenn Sie den Datenbildschirm erreichen, wählen Sie Alle herunterladen.
Wenn der Download abgeschlossen ist, finden Sie "titanic.zip". Entpacken Sie diese Datei. Nach dem Entpacken sehen Sie die folgenden Dateien.
Die Verwendung jeder Datei ist wie folgt.
Dateiname | Verwenden |
---|---|
train.csv | Lehrerdaten |
test.csv | Testdaten |
gender_submission.csv | Beispieldaten für die Buchung |
** Beschreibung der Datenvariablen **
Spaltenname | japanisch |
---|---|
PassengerID | Passagierausweis |
Survived | Überlebensergebnis(1:Überleben, 0:Tod) |
Pclass | Raumklasse 1=Upper, 2=Middle, 3=Lower |
Name | Name |
Sex | Sex |
Age | Alter |
SibSp | Anzahl der Brüder und Ehepartner |
Parch | Anzahl der Eltern und Kinder |
Ticket | Ticketnummer |
Fare | Boarding Gebühr |
Cabin | Zimmernummer |
Embarked | Drei Arten von Häfen an Bord: Cherbourg, Queenstown und Southampton |
Erstellen Sie ein VARISTA-Konto. Gehen Sie zu http://www.varista.ai und registrieren Sie sich von der oberen Seite. Wenn Sie sich von diesem Konto aus registrieren, handelt es sich übrigens um ein Guthaben, das für den Dienst verwendet werden kann. Wenn Sie nichts dagegen haben, würde ich mich freuen, wenn Sie über diesen Link fliegen könnten. .. Wenn es dir nicht gefällt, kannst du überhaupt von ↑ fliegen. .. Ich wusste es nicht··. https://console.varista.ai/welcome/jamaica-draft-coach-cup-blend
Es scheint einen bezahlten Plan zu geben, aber vorerst habe ich ihn kostenlos ausprobiert.
Erstellen Sie nach der Anmeldung bei VARISTA einen Arbeitsbereich mit einem beliebigen Namen. Erstellen Sie nach dem Erstellen des Arbeitsbereichs das Projekt. Ich denke, der Name könnte Titanic sein.
Folgen Sie der Anleitung, um die Daten hochzuladen.
Die hochzuladenden Daten sind die Lehrerdaten "train.csv".
Wenn der Upload abgeschlossen ist, wählen Sie die Spalte aus, die Sie vorhersagen möchten. In diesem Wettbewerb möchte ich das Überleben der Passagiere vorhersagen, daher werde ich "Überlebt" auswählen.
Wählen Sie START, für das die Einstellungen abgeschlossen wurden, um zum nächsten Bildschirm zu gelangen.
Sobald Sie Ihr Ziel ausgewählt haben, können Sie loslegen.
Sie können hier plötzlich anfangen zu lernen, aber da es eine große Sache ist, schauen wir uns den Inhalt der Daten an. Wählen Sie das Datenmenü und wählen Sie die zuvor hochgeladene "train.csv".
Wenn Sie sich die Datenmängel ansehen, können Sie feststellen, dass die Alters- und Kabinendaten Mängel aufweisen. Im Fall von VARISTA scheinen fehlende Daten jedoch automatisch ergänzt zu werden.
Schauen wir uns die Verteilung der Daten an. Wenn Sie auf der Registerkarte "Visualisieren" auswählen, wird die Verteilung für alle Daten in der Feature-Spalte angezeigt. Dies ist praktisch. Wenn Sie die Registerkarte Korrelation auswählen, können Sie die Korrelation zwischen den Spalten, die Sie vorhersagen möchten, und jeder Spalte anzeigen.
** Geschlecht, Alter ** Versuchen Sie, 0 durch Tod und 1 durch Überleben zu ersetzen. Das Geschlecht hat viel damit zu tun, und Frauen scheinen am Leben zu sein. Was das Alter betrifft, so ist die Überlebensrate unter 7 Jahren im Allgemeinen hoch, und die Sterblichkeitsrate scheint nach 60 Jahren hoch zu sein. Es scheint keinen großen Unterschied in der Mitte zu geben. Das Kind scheint bevorzugt gerettet worden zu sein
PClass Je höher der Grad, desto höher die Überlebensrate.
Lass uns tatsächlich lernen. Wählen Sie links das KI-Modell aus und klicken Sie auf "KI-Modell erstellen". Stellen Sie als Nächstes sicher, dass die Spalte, die Sie vorhersagen möchten, "Überlebt" ist, und klicken Sie auf die Schaltfläche "Lernen starten".
Das Lernen beginnt automatisch ohne Einstellungen, insbesondere auf dieser Seite, die heutzutage sehr beliebt ist. Es scheint, dass Feature Quantity Engineering durchgeführt wird und das Lernen mit mehreren Algorithmen erfolgt.
Es hat eine Punktzahl von 70. Betrachtet man den Grad des Einflusses, so scheint es, dass Geschlecht und Klasse mit dem Überleben zusammenhängen.
Klicken Sie auf dem Bildschirm ↑ auf ** Mit diesem Modell vorhersagen **. Klicken Sie hier, um das Ausgabeformat zu ändern.
Legen Sie die Spalten fest, die nicht ausgegeben werden.
Ändern Sie dann das Format der Ausgabespalten in Flags.
Ziehen Sie abschließend test.csv aus der zuvor heruntergeladenen Datei und legen Sie sie dort ab.
Laden Sie die fertige Datei herunter.
Wenn Sie die Datei öffnen, sehen Sie, dass die Spalte ganz rechts die Vorhersage des Überlebens enthält. Es gibt Spalten, die nicht zum Posten in Kaggle benötigt werden. Löschen Sie sie daher. Dieses Mal habe ich es mit Numbers auf dem Mac entfernt, aber ich denke, Excel usw. ist gut für Windows.
Wählen Sie im Kaggle-Wettbewerbsbildschirm "Vorhersagen senden" und ziehen Sie die zuvor heruntergeladene Datei per Drag & Drop.
Zum Schluss drücken Sie Make Submission, um Beiträge zu veröffentlichen. Nach einer Weile wird es gewertet und das Ergebnis wird ausgegeben.
Die Punktzahl betrug diesmal 0,77511.
Ich habe das Lernniveau, das Verhältnis der Verifizierungsdaten, die Anzahl der Unterteilungen der Kreuzungsüberprüfung und den Wert des zufälligen Startwerts aus den Lerneinstellungen geändert und die Punktzahl verbessert, sodass ich sie veröffentlichen werde.
Klicken Sie oben rechts im Startbildschirm für das Modelllernen auf die Einstellungsschaltfläche.
Ich habe versucht, den Wert so zu machen. Ich habe es nicht so oft ausprobiert, daher gibt es möglicherweise bessere Einstellungen, aber ich werde es später versuchen.
Jetzt lernen wir noch einmal und unterwerfen uns erneut Kaggle.
Die Punktzahl stieg auf 0,80861. Das Erlernen von Level 3 dauert ungefähr 30 Minuten, daher möchte ich verschiedene Dinge ausprobieren und mehr schreiben.
Recommended Posts