[PYTHON] Ein einführender Leser der Theorie des maschinellen Lernens für IT-Ingenieure versuchte es mit Kaggle

Was ist Kaggle?

Wikipedia

Kaggle ist eine Plattform für prädiktive Modellierungs- und Analysemethoden und deren Betriebsgesellschaft, auf der Unternehmen und Forscher Daten veröffentlichen und Statistiker und Datenanalysten auf der ganzen Welt um das optimale Modell konkurrieren.

Grob gesagt die Data Scientist-Version von TopCoder

Hintergrund

Als Vorgeschmack auf moderne Ingenieure [Einführung in die Theorie des maschinellen Lernens für IT-Ingenieure](https://www.amazon.co.jp/IT%E3%82%A8%E3%83%B3%E3%82%B8% E3% 83% 8B% E3% 82% A2% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E7% 90% 86% E8% AB% 96% E5% 85% A5% E9% 96% 80-% E4% B8% AD% E4% BA% 95-% E6% Ich habe 82% A6% E5% 8F% B8 / dp / 4774176982) gelesen, aber ich habe keine Chance, maschinelles Lernen bei der Arbeit zu verwenden, da ich nicht in der Datenanalyse arbeite. Sie können maschinelles Lernen nicht lernen, ohne Ihre Hände tatsächlich zu bewegen, aber es scheint schwierig zu sein, Ihre Hände zu bewegen, da Vorbereitungen wie das Vorbereiten eines Datensatzes erforderlich sind. Daher weiß ich nicht, was eigentlich zum Lernen als Lehrmaterial geeignet ist (MNIST?). .. Als moderner Ingenieur möchte ich in der Lage sein, Online-Lernen und die Community richtig zu nutzen und auch Kenntnisse darüber zu erlangen. Ich mochte die Kaggle-Wettbewerbe von Dataquest, die ich als Tutorial ausprobiert habe.

Ziel in diesem Artikel

Nehmen Sie an Kaggles Wettbewerb Titanic: Maschinelles Lernen aus Katastrophen teil und gewinnen Sie Ihr Ranking im Wettbewerb.

Getting Start

Annahme

Ich habe logistische Regression und zufälligen Wald durch maschinelles Lernen gelernt Wenden Sie Python-Code an Python-Ausführungsumgebung

Was zu haben

Umgebung, in der Jupyter Notebook geschrieben werden kann Englischkenntnisse, die nicht so ungern englische technische Websites lesen

Dinge, die du diesmal nicht brauchst

GPU-Umgebung Tiefes Lernwissen

Tutorial zu Dataquest Kaggle-Wettbewerben

Kaggle-Wettbewerb Eine Online-Lernseite, die mit Titanic herauskommt.

Free Kaggle Tutorial - Getting Started with the Titanic Dataset

Wenn Sie ein Google- oder Facebook-Konto haben, können Sie das Tutorial starten, sobald Sie sich anmelden.

Basierend auf den Überlebensdaten von Titanic-Passagieren wird ein parametrisches Modell erstellt, das die Überlebenswahrscheinlichkeit für Passagiere in den Testdaten berechnet, und die Leistung des Modells wird konkurriert. Das Thema ist Kaggles Wettbewerb. Von der Vorverarbeitung über die Modellerstellung, das Training von Trainingsdatensätzen bis hin zum Testen der Datensatzvorhersage werden wir mit dem Lernprogramm fortfahren und das Problem des Schreibens von Python-Code an wichtigen Punkten lösen.

data_quest_titanic_python.JPG

Dieser Bildschirm ist ein Beispiel für den Bildschirm des Dataquest-Lernprogramms. Links wird ein Beispiel angezeigt. Schreiben Sie den Python-Code auf den Bildschirm rechts, drücken Sie die Ausführungs-Taste. Wenn das Ergebnis des Codes korrekt ist, wird "Gute Arbeit" angezeigt und Sie fahren mit dem nächsten Bildschirm fort.

Das Tutorial unterstützt sogar die Generierung einer Datei, die die Vorhersageergebnisse des Testdatensatzes des Modells sendet, das tatsächlich zum Kaggle erstellt wurde. Es gibt zwei Kaggle-Wettbewerbskurse in Dataquest, der erste ist ein einfaches logistisches Regressionsmodell, um den Ablauf zu erfahren, und der nächste Kurs zur Verbesserung Ihrer Einreichung ist mit einem Ensemble-Lernmodell genau. Es ist ein Kurs, der sich darauf konzentriert, durch Erhöhen eine Punktzahl anzustreben.

Wenn Sie das Wissen in der Prämisse geschrieben haben, denke ich, dass jeder Kurs in 2 Stunden abgeschlossen werden kann.

Organisieren Sie nach dem Erlernen des Lernprogramms, was Sie in Ihrer Python-Ausführungsumgebung gelernt haben, (obwohl Sie nur den Code kopieren und einfügen, den Sie im Lernprogramm geschrieben haben), und senden Sie die Datei tatsächlich an Kaggle. Ich habe versucht, den Code [hier] zu generieren (https://github.com/takaaki-inada/kaggle_titanic/blob/master/kaggle_titanic.ipynb).

Senden Sie dies an Kaggle!

kaggle_titanic_complete.JPG

Es war 1231. im 7071 Team!

Zusammenfassung

Sie können es in kurzer Zeit erleben, ohne sich darüber Gedanken machen zu müssen. Ich dachte, es wäre ein gutes Material für Selbststudien und Lernsitzungen, nachdem Sie das Einführungsbuch über maschinelles Lernen gelesen haben. Dies ist eine Startlinie, und selbst wenn Sie selbst ein Modell entwickeln, können Sie lernen, die Punktzahl etwas weiter zu erhöhen. Ich nehme auch an anderen Wettbewerben teil. In meinem Fall studiere ich Deep Learning, daher verweise ich auf verschiedene Websites für den Wettbewerb von Hunden gegen Katzen. Ich versuchte weiterzumachen. Zur Zeit lag die Punktzahl bei 0,14160 und die Punktzahl bei 697./1314 Teams. Es scheint jedoch, dass der Wettbewerb bereits geschlossen ist. Wenn er geschlossen ist, wird er nicht im Rang registriert, was etwas enttäuschend ist. tat.

Beiseite

Der Autor der Einführung in die Theorie des maschinellen Lernens für IT-Ingenieure war im gleichen Alter wie ich und Absolvent derselben Fakultät für Naturwissenschaften am Fachbereich Physik (obwohl an einer anderen Universität). Ich möchte die Gewichte von Neuronen lernen, indem ich das neuronale Netzwerk meines Gehirns mit dem Autor als Lehrerdaten zurückpropagiere, um herauszufinden, wo und wo es einen solchen Unterschied gibt. .. ..

Recommended Posts

Ein einführender Leser der Theorie des maschinellen Lernens für IT-Ingenieure versuchte es mit Kaggle
Ich habe versucht, das überwachte Lernen des maschinellen Lernens auch für Serveringenieure auf leicht verständliche Weise zu verstehen 1
Ich habe versucht, das überwachte Lernen des maschinellen Lernens auch für Serveringenieure auf leicht verständliche Weise zu verstehen 2
[Maschinelles Lernen] Ich habe versucht, die Theorie von Adaboost zusammenzufassen
Eine Einführung in OpenCV für maschinelles Lernen
2020 Empfohlen 20 Auswahlmöglichkeiten für einführende Bücher zum maschinellen Lernen
Eine Einführung in Python für maschinelles Lernen
Eine Einführung in maschinelles Lernen für Bot-Entwickler
Maschinelles Lernen des Sports - Analyse der J-League als Beispiel - ②
Ich habe versucht, mit Python (Mac OS X) eine Umgebung für maschinelles Lernen zu erstellen.
Erstellen Sie mit Python eine interaktive Umgebung für maschinelles Lernen
[Empfohlenes Tagging beim maschinellen Lernen # 2] Erweiterung des Scraping-Skripts
[Empfohlenes Tagging beim maschinellen Lernen # 2.5] Änderung des Scraping-Skripts
Ich habe versucht, die Genauigkeit von Modellen für maschinelles Lernen mit Kaggle als Thema zu vergleichen.
Erstellen Sie eine Umgebung für maschinelles Lernen mit Python unter MacOSX
[Empfohlenes Tagging mit maschinellem Lernen # 1] Scraping von Hatena-Blog-Artikeln
Das Ergebnis des maschinellen Lernens von Java-Ingenieuren mit Python www
Leistungsüberprüfung der Datenvorverarbeitung für maschinelles Lernen (numerische Daten) (Teil 2)
Ich habe versucht, Tensorboard zu verwenden, ein Visualisierungstool für maschinelles Lernen
Leistungsüberprüfung der Datenvorverarbeitung für maschinelles Lernen (numerische Daten) (Teil 1)
Ich habe versucht, Othello AI mit Tensorflow zu machen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Einführung ~
Ich habe versucht, Othello AI mit Tensorflow zu erstellen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Implementierung ~
Datensatz für maschinelles Lernen
Japanische Vorverarbeitung für maschinelles Lernen
Grundlagen des maschinellen Lernens (Denkmal)
Anfänger des maschinellen Lernens versuchten RBM
Bedeutung von Datensätzen für maschinelles Lernen
Versuchen Sie es mit Kaggle leicht maschinell
[Python Machine Learning] Empfehlung zur Verwendung von Spyder für Anfänger (Stand August 2020)
Zusammenfassung der empfohlenen APIs für künstliche Intelligenz, maschinelles Lernen und KI
Wie nutzt man maschinelles Lernen für die Arbeit? 01_ Den Zweck des maschinellen Lernens verstehen
[Maschinelles Lernen] Ich habe versucht, so etwas wie Bilder weiterzugeben
Ich habe versucht, Othello AI mit Tensorflow zu erstellen, ohne die Theorie des maschinellen Lernens zu verstehen ~ Battle Edition ~