Wikipedia
Kaggle ist eine Plattform für prädiktive Modellierungs- und Analysemethoden und deren Betriebsgesellschaft, auf der Unternehmen und Forscher Daten veröffentlichen und Statistiker und Datenanalysten auf der ganzen Welt um das optimale Modell konkurrieren.
Grob gesagt die Data Scientist-Version von TopCoder
Als Vorgeschmack auf moderne Ingenieure [Einführung in die Theorie des maschinellen Lernens für IT-Ingenieure](https://www.amazon.co.jp/IT%E3%82%A8%E3%83%B3%E3%82%B8% E3% 83% 8B% E3% 82% A2% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E7% 90% 86% E8% AB% 96% E5% 85% A5% E9% 96% 80-% E4% B8% AD% E4% BA% 95-% E6% Ich habe 82% A6% E5% 8F% B8 / dp / 4774176982) gelesen, aber ich habe keine Chance, maschinelles Lernen bei der Arbeit zu verwenden, da ich nicht in der Datenanalyse arbeite. Sie können maschinelles Lernen nicht lernen, ohne Ihre Hände tatsächlich zu bewegen, aber es scheint schwierig zu sein, Ihre Hände zu bewegen, da Vorbereitungen wie das Vorbereiten eines Datensatzes erforderlich sind. Daher weiß ich nicht, was eigentlich zum Lernen als Lehrmaterial geeignet ist (MNIST?). .. Als moderner Ingenieur möchte ich in der Lage sein, Online-Lernen und die Community richtig zu nutzen und auch Kenntnisse darüber zu erlangen. Ich mochte die Kaggle-Wettbewerbe von Dataquest, die ich als Tutorial ausprobiert habe.
Nehmen Sie an Kaggles Wettbewerb Titanic: Maschinelles Lernen aus Katastrophen teil und gewinnen Sie Ihr Ranking im Wettbewerb.
Getting Start
Ich habe logistische Regression und zufälligen Wald durch maschinelles Lernen gelernt Wenden Sie Python-Code an Python-Ausführungsumgebung
Umgebung, in der Jupyter Notebook geschrieben werden kann Englischkenntnisse, die nicht so ungern englische technische Websites lesen
GPU-Umgebung Tiefes Lernwissen
Kaggle-Wettbewerb Eine Online-Lernseite, die mit Titanic herauskommt.
Free Kaggle Tutorial - Getting Started with the Titanic Dataset
Wenn Sie ein Google- oder Facebook-Konto haben, können Sie das Tutorial starten, sobald Sie sich anmelden.
Basierend auf den Überlebensdaten von Titanic-Passagieren wird ein parametrisches Modell erstellt, das die Überlebenswahrscheinlichkeit für Passagiere in den Testdaten berechnet, und die Leistung des Modells wird konkurriert. Das Thema ist Kaggles Wettbewerb. Von der Vorverarbeitung über die Modellerstellung, das Training von Trainingsdatensätzen bis hin zum Testen der Datensatzvorhersage werden wir mit dem Lernprogramm fortfahren und das Problem des Schreibens von Python-Code an wichtigen Punkten lösen.
Dieser Bildschirm ist ein Beispiel für den Bildschirm des Dataquest-Lernprogramms. Links wird ein Beispiel angezeigt. Schreiben Sie den Python-Code auf den Bildschirm rechts, drücken Sie die Ausführungs-Taste. Wenn das Ergebnis des Codes korrekt ist, wird "Gute Arbeit" angezeigt und Sie fahren mit dem nächsten Bildschirm fort.
Das Tutorial unterstützt sogar die Generierung einer Datei, die die Vorhersageergebnisse des Testdatensatzes des Modells sendet, das tatsächlich zum Kaggle erstellt wurde. Es gibt zwei Kaggle-Wettbewerbskurse in Dataquest, der erste ist ein einfaches logistisches Regressionsmodell, um den Ablauf zu erfahren, und der nächste Kurs zur Verbesserung Ihrer Einreichung ist mit einem Ensemble-Lernmodell genau. Es ist ein Kurs, der sich darauf konzentriert, durch Erhöhen eine Punktzahl anzustreben.
Wenn Sie das Wissen in der Prämisse geschrieben haben, denke ich, dass jeder Kurs in 2 Stunden abgeschlossen werden kann.
Organisieren Sie nach dem Erlernen des Lernprogramms, was Sie in Ihrer Python-Ausführungsumgebung gelernt haben, (obwohl Sie nur den Code kopieren und einfügen, den Sie im Lernprogramm geschrieben haben), und senden Sie die Datei tatsächlich an Kaggle. Ich habe versucht, den Code [hier] zu generieren (https://github.com/takaaki-inada/kaggle_titanic/blob/master/kaggle_titanic.ipynb).
Senden Sie dies an Kaggle!
Es war 1231. im 7071 Team!
Sie können es in kurzer Zeit erleben, ohne sich darüber Gedanken machen zu müssen. Ich dachte, es wäre ein gutes Material für Selbststudien und Lernsitzungen, nachdem Sie das Einführungsbuch über maschinelles Lernen gelesen haben. Dies ist eine Startlinie, und selbst wenn Sie selbst ein Modell entwickeln, können Sie lernen, die Punktzahl etwas weiter zu erhöhen. Ich nehme auch an anderen Wettbewerben teil. In meinem Fall studiere ich Deep Learning, daher verweise ich auf verschiedene Websites für den Wettbewerb von Hunden gegen Katzen. Ich versuchte weiterzumachen. Zur Zeit lag die Punktzahl bei 0,14160 und die Punktzahl bei 697./1314 Teams. Es scheint jedoch, dass der Wettbewerb bereits geschlossen ist. Wenn er geschlossen ist, wird er nicht im Rang registriert, was etwas enttäuschend ist. tat.
Der Autor der Einführung in die Theorie des maschinellen Lernens für IT-Ingenieure war im gleichen Alter wie ich und Absolvent derselben Fakultät für Naturwissenschaften am Fachbereich Physik (obwohl an einer anderen Universität). Ich möchte die Gewichte von Neuronen lernen, indem ich das neuronale Netzwerk meines Gehirns mit dem Autor als Lehrerdaten zurückpropagiere, um herauszufinden, wo und wo es einen solchen Unterschied gibt. .. ..
Recommended Posts