[PYTHON] [Für Nicht-Programmierer] Wie man Kaggle läuft

Dieser Artikel ist der dritte Tag des Adventskalenders in Kaggle Adventskalender 2019.

Ich hoffe, es ist hilfreich für diejenigen, die denken "** Kaggle ist interessiert, aber es ist passend und beängstigend ... **"!

Bis ich Kaggle traf

Mein Hintergrund, bevor ich Kaggle traf, ist wie folgt.

--Marketer ⇒ Berater

図13.png

Ich war in einem solchen Zustand, aber im letzten Jahr habe ich Python und maschinelles Lernen studiert und es geschafft, Kaggle zu verstehen. Also werde ich mir vor einem Jahr schreiben, dass es gut ist, das zu wissen.

Zielgruppe

An wen?

Was?

--Kaggle ist einen Versuch wert!

Was ist "Kaggle"?

Was ist Kaggle?

Mit einem Wort, es ist der Tenkaichi Budokai der Datenanalyse mit "maschinellem Lernen". image.png

Zu analysierende Daten

Wettbewerbszeitraum

――Für ungefähr 1 bis 3 Monate

Rangfolge

--Erstellen Sie ein Modell für maschinelles Lernen und ordnen Sie es nach dem Vorhersageergebnis des Modells

Preis

――Es gibt auch einen Wettbewerb, bei dem die besten Spieler mit Preisen ausgezeichnet werden

Eintrittspreis

Registrierter Nutzer

Über Rang

Kaggle hat je nach Stärke 5 Ränge. (Genau genommen können Sie einen Rang nicht nur durch Ihre Stärke im Wettbewerb erreichen, sondern auch durch Ihren Beitrag zur Kaggle-Community wie Kernel, Diskussion, Datensätze.)

Es ist keine Übertreibung zu sagen, dass die Leute, die an Kaggle (allgemein bekannt als Kaggler) arbeiten, jeden Tag viel Zeit damit verbringen, sich zu messen, um diesen Rang zu erhöhen (wahrscheinlich).

Anzahl der Personen nach Rang

Die Anzahl der Personen per Dezember 2019 ist wie folgt キャプチャ.PNG

Bild von jedem Rang

Es ist eine Gliederung und ein Bilddiagramm jedes Ranges. (Es ist nur subjektiv) 図1.png

Rank up Bedingungen

Klicken Sie hier für die Ranglistenbedingungen. (In Wettbewerben) Experte bittet plötzlich um eine Medaille. .. .. Wenn Sie ein Anfänger sind, möchten Sie zuerst den Experten anstreben. 図2.png

Bedingungen für den Erwerb von Medaillen

Es gibt drei Arten von Medaillen: Gold, Silber und Bronze.

Klicken Sie hier für die Bedingungen für den Erwerb der Medaille. (In Wettbewerben) Strenge Bedingungen variieren je nach Anzahl der Teilnehmer, aber das Folgende ist eine Anleitung.

図3.png

Zum Beispiel ein solcher Wettbewerb

Vorhersage der Überlebenden des Untergangs der Titanic

Vorhersage der Geschwindigkeit, mit der Hunde und Katzen in Tierhandlungen abgeholt werden

Vorteile von Kaggle

Ich habe drei Vorteile von Kaggle aufgelistet.

① Verstehen Sie Ihre eigenen datenwissenschaftlichen Fähigkeiten (beweisen Sie auch)

Datenwissenschaftliche Fähigkeiten sind ohne Übung schwer zu messen. Das Sammeln von Medaillen und Rängen in Kaggle kann jedoch Ihre ungefähren datenwissenschaftlichen Fähigkeiten unter Beweis stellen. In letzter Zeit nimmt die Zahl der Unternehmen, die Kaggle einführen, allmählich zu, was auch ein Beweis für die Steigerung ist. 図4.png

② Lernen Sie das Know-how von Datenwissenschaftlern aus aller Welt kennen (kostenlos!)

Wie ich durch die tatsächliche Teilnahme am Wettbewerb erfahren habe, hat Kaggle eine wunderbare Kultur des Austauschs von Know-how und Informationen, nicht nur des Wettbewerbs mit anderen. Insbesondere "Notebooks" erklärt das Know-how und die Trends der Datenwissenschaft auf leicht verständliche Weise zusammen mit dem Code und wird Anfängern empfohlen. 図5.png

③ Sie können verstehen, was maschinelles Lernen auf Hautebene bewirkt

Heutzutage wird maschinelles Lernen immer mehr in die Apps und Marketing-Tools um uns herum integriert. Wenn Sie Kaggle ausführen, können Sie den Modellierungsprozess des maschinellen Lernens beherrschen, um zu verstehen, was Sie mit maschinellem Lernen tun können und was nicht. 図6.png

Kaggle sollte hier anfangen

Es scheint verschiedene Meinungsverschiedenheiten zu geben, aber es gibt drei persönliche Punkte unten.

(1) Maschinelles Lernen / Python Wenn Sie keine Kenntnisse haben, wählen Sie ein "Matsuo Lab" Lehrbuch aus!

Matsuo Laboratory der Universität Tokio, bekannt für maschinelles Lernen / KI.

Sie können den Text des "Data Scientist Training Course" des Matsuo Laboratory kostenlos herunterladen. Das ist erstaunlich, es ist ein Vorfall! Der Text und der Python-Code erläutern sorgfältig die Abschlussstufe des maschinellen Lernens für Anfänger. Wenn Sie also Schwierigkeiten haben, den Inhalt von Kaggle zu verstehen, sollten Sie dies vervollständigen.

▼ Klicken Sie hier, um den Text "Matsuo Lab" herunterzuladen https://weblab.t.u-tokyo.ac.jp/gci_contents/

図8.png

② Verwenden Sie "Notizbücher", um diejenigen mit einer hohen Anzahl von Stimmen zu kopieren und den Dreh raus zu bekommen!

Wie ich bereits erwähnt habe, sind die "Notizbücher" in jedem Wettbewerb eine Fundgrube.

Wenn Sie einen Wettbewerb auswählen, an dem Sie leicht arbeiten können, wird empfohlen, ein Notizbuch mit einer hohen Anzahl von Stimmen in "Notizbücher" zu kopieren. Notizbücher mit einer hohen Stimmenzahl werden sorgfältig ausgewählt und sind leicht zu verstehen, sodass Sie den Fluss von der Datenerfassung bis zur Übermittlung der Modellergebnisse durch Kopieren nacherleben und die Tipps des maschinellen Lernens erlernen können. 図10.png

③ Wenn Sie alleine sind, bleiben Sie ohne Informationen stecken, daher wird empfohlen, sich mit jemandem zu verbinden!

Kaggle ist eine einfache Einzelschlacht. Die Wettkampfdauer beträgt jedoch 1 bis 3 Monate, und die Motivation kann nachlassen oder ins Stocken geraten.

In einem solchen Fall können Sie, wenn Sie Freunde haben, die Kaggle machen, nützliche Informationen teilen (privates Teilen ist NG) und sich gegenseitig ermutigen, und Sie können Kaggle mehr genießen.

Persönlich empfehle ich die folgenden drei.

図11.png

schließlich

Kaggle ist eine großartige Plattform für Anfänger bis Fortgeschrittene des maschinellen Lernens / der Datenanalyse.

Wenn Sie Kaggle machen, können Sie mit TOP-Datenwissenschaftlern auf der ganzen Welt konkurrieren, Informationen austauschen und sich unterrichten lassen. Als ich jedoch sorgfältig darüber nachdachte, wurde mir klar, dass dies erstaunlich ist, und als ich diesen Artikel schrieb, wurde mir dies erneut klar.

図12.png

Von nun an möchte ich einen kleinen Beitrag leisten, um Kaggle auf einer guten Plattform zu halten! (Zunächst möchte ich eine Medaille ...)

Recommended Posts

[Für Nicht-Programmierer] Wie man Kaggle läuft
So suchen Sie nach fehlenden Werten (Kaggle: House Prices)
So erstellen Sie eine * .spec-Datei für pyinstaller.
[Python] Organisieren der Verwendung für Anweisungen
So installieren Sie das Windows-Subsystem für Linux
Verwendung von "deque" für Python-Daten
Verwendung der Fingerabdruckauthentifizierung für KDE
So verwenden Sie MkDocs zum ersten Mal
So erstellen Sie ein Spigot-Plug-In (für Java-Anfänger)
Verwendung von Template Engine für Network Engineer
So installieren Sie Python für Forscher von Pharmaunternehmen
Verwendung von Datenanalysetools für Anfänger
So schreiben Sie einen ShellScript Bash für Anweisung
[ESXi (vCenter)] Hinzufügen einer Netzwerkkarte für CentOS 7.3
Wie man Python für Anfänger schneller macht [numpy]
[Für Anfänger] Wie man Programmierung studiert Private Memo
So finden Sie die Korrelation für kategoriale Variablen
So erzwingen Sie, dass TensorFlow 2.3.0 für CUDA11 + cuDNN8 erstellt wird
Festlegen der CPU-Affinität für Prozessthreads
Verwendung von xml.etree.ElementTree
Wie benutzt man Python-Shell
[Für Anfänger] Wie man den Befehl say mit Python benutzt!
Hinweise zur Verwendung von tf.data
Verwendung von virtualenv
Schaben 2 Wie man kratzt
Wie benutzt man Seaboan?
Verwendung von Image-Match
Wie man Shogun benutzt
So konvertieren Sie den Python # -Typ für Super-Anfänger von Python: str
So installieren Sie Python
Verwendung von Pandas 2
[Für Anfänger] So studieren Sie den Python3-Datenanalysetest
Wie man PyPI liest
So installieren Sie pip
Verwendung von Virtualenv
Verwendung von numpy.vectorize
So aktualisieren Sie easy_install
So installieren Sie archlinux
So führen Sie Python im virtuellen Raum aus (für MacOS)
Verwendung von pytest_report_header
Wie man Gunicorn neu startet
[Go] So erstellen Sie einen benutzerdefinierten Fehler für Sentry
So installieren Sie Python
Wie zum virtuellen Host
Wie man Selen debuggt
Wie man teilweise verwendet
Wie man Bio.Phylo benutzt
[Einführung in Azure für Kaggle-Benutzer] Vergleich zum Starten und Verwenden von Azure Notebooks und Azure Notebooks VM
Wie man JSON liest
So führen Sie einen Komponententest durch Teil 2 Klassendesign zum Testen
Verwendung von SymPy
Wie man x-means benutzt
Verwendung von WikiExtractor.py
So aktualisieren Sie Spyder
Verwendung von IPython
So installieren Sie BayesOpt
Verwendung von virtualenv
Wie benutzt man Matplotlib?