[PYTHON] Tag 70 GCI2019Winter wurde erfolgreich abgeschlossen!

Der im Dezember begonnene Kurs für Datenwissenschaftler an der Universität Tokio wurde erfolgreich abgeschlossen! GCI-Online-Kurs Todai Data Scientist / Online-Kurs für zukünftige CMO-Schulungen Es ist kostenlos, wenn Sie innerhalb von 3 Monaten einen Datenwissenschaftler anfordern.

● Kursbeschreibung
*Analysieren und analysieren Sie eine große Datenmenge frei, um versteckte Beziehungen zu entdecken. Die Nachfrage nach "Datenwissenschaftlern", die solche Fähigkeiten erworben haben, steigt nicht nur im technischen Bereich, sondern auch in zahlreichen Bereichen wie medizinische Versorgung, Wirtschaft, Management und Biowissenschaften.
*In diesem Kurs erwerben Sie umfassend die Grundlagen des maschinellen Lernens und der Big-Data-Handling-Technologie, die den Kern der Datenanalyse- und Analysefähigkeiten bilden, die in allen Bereichen eine Waffe darstellen, sowie die Technologie, mit der Analyseergebnisse effektiv visualisiert werden. Wir wollen am Eingang stehen, um eine aktive Rolle als Datenwissenschaftler zu spielen.
*Es gibt keine Studiengebühren (Kommunikationsgebühren usw. sind von Ihnen selbst zu tragen).

Auf jeden Fall gibt es viele Aufgaben. In den letzten drei Monaten habe ich mich jeden Tag mit maschinellem Lernen beschäftigt. Das Lehrbuch des Vorjahres war im Verkauf, also habe ich es durchgesehen, aber ich wollte es gerade werfen, weil es zu schwierig war.

Data Scientist Training Course an der Universität Tokio Kunitaka Tsukamoto https://www.amazon.co.jp/dp/B07PD237GQ/ref=cm_sw_r_tw_dp_U_x_j1bHEb66RA461

Der Text war jedoch gut entwickelt, ich konnte jederzeit Fragen zu Slack stellen, ich nahm am Team teil und das Support-System half mir sehr und ich schaffte es, ihn zu beenden.

Sie können den Text lesen, der am besten geworden ist. Das gibt mir Vertrauen. Wir rekrutieren ab April wieder Studenten, daher möchte ich es jedem empfehlen, der von nun an mit maschinellem Lernen beginnen möchte.

Anwesenheitstest (12 / 7-12)

Vor dem Besuch des Kurses wurde ein Test durchgeführt, um die Fähigkeit zu bestätigen. Es ist eine Grundstufe wie WhirlwindTourOfPython. Das Linkziel wurde plötzlich durch die Erklärung auf Englisch verwirrt. Ich habe es geschafft, es zu löschen, weil ich Python gebissen habe. Das Problem besteht darin, das Matrixproblem mit Python zu lösen. Die Mathematik war in der Junior High School frustriert, so dass ich die Bedeutung des Problems überhaupt nicht verstehen konnte. Ich habe es geschafft, indem ich mich von jemandem unterrichten ließ, der gut in Mathematik ist.

Teil 1 (18.12.) Was ist Data Science? Python-Grundlagen, Bibliotheken

Obwohl aufgrund der Einführung der IT eine große Datenmenge vorhanden ist, wurden diese kaum analysiert. Als ich dies analysierte, war es ein Vortrag, den ich im Geschäftsleben enorm nutzen konnte. Es war interessant zu sehen, wie das Video am nächsten Tag geliefert wurde. Dann Python-Grundlagen.

Teil 2 (25.12.) Grundlagen der wissenschaftlichen Berechnung und Datenverarbeitung durch Python (Numpy, Pandas)

Ich habe Python-Tabellenberechnung gelernt. Es ist alles wie Excel für Befehle. Aggregation, Statistiken usw. Danach habe ich viel verwendet.

Wettbewerb 1 Vorhersage von Leben und Tod der Titanic.

Gleich wie Kaggles Titanic: Maschinelles Lernen aus Katastrophen. Zuerst wusste ich überhaupt nichts, und selbst wenn ich einen Film sah und eine Vorhersage machte, tastete ich im Dunkeln, wie ich ihn umsetzen sollte. Ich war hartnäckig beim Meinungsaustausch mit Kaggle, dem Team und Slack. Es wird interessant, wenn die Idee zu einer Punktzahl führt. Ich rangierte im Boosting, um das Ergebnis für die nächste Vorhersage wiederzuverwenden. Der High-Level-Code wird nach dem Wettbewerb veröffentlicht, aber ich bin nur beeindruckt, dass es einige wirklich kluge Leute gibt.

Teil 3 (1/8) Datenvisualisierung in der Datenwissenschaft (Matplotlib)

Ich habe gelernt, wie man Graphen, Korrelationsmatrizen und Wärmekarten erstellt. Es ist schwer auszudrücken, wie Sie möchten, daher ist es eine gute Idee, zunächst schöne Grafiken zu sammeln und den Code zu kopieren und einzufügen, um sich daran zu gewöhnen.

4. (1/15) Grundlagen der probabilistischen Statistik

Zeichnen von Statistiken wie Summen und Durchschnittswerten, Streudiagrammen und Diagrammen wie Histogrammen. Ich kenne die Wahrscheinlichkeit und Statistik überhaupt nicht. Ich konnte endlich das Anfängerproblem lösen.

Wettbewerb 2 Weinqualität

Aus dem portugiesischen Weinprojekt werden die Zutaten von 4898 Flaschen und die Bewertung durch den Sommelier gelesen und der Geschmack anhand der Zutaten vorhergesagt. Ich liebe Wein. Es war ein lustiger Wettbewerb, das Etikett des Weins im Laden zu lesen und darüber nachzudenken.

5. (1/29) Grundlagen des maschinellen Lernens (Lernen mit dem Lehrer)

Über überwachtes Lernen, unbeaufsichtigtes Lernen und verbessertes Lernen. Eine detaillierte Erklärung der Methode zur Vorhersage von Titanic und Wein. Wenn Sie dem Tutorial zu multipler Regression, logistischer Regression, Lasso-Regression, Ridge-Regression, K-NN und Support-Vektor-Maschine folgen, können Sie es irgendwie verwenden.

6. (2/5) Grundlagen des maschinellen Lernens (Lernen ohne Lehrer)

Ich lernte unbeaufsichtigtes Lernen und baute ein Lernmodell ohne objektive Variablen auf. Grobe Klassifizierung, Clustering, Hauptkomponentenanalyse ... Um ehrlich zu sein, verstehe ich immer noch nicht gut. Es ist praktisch, Daten ohne vorherige Informationen überprüfen zu können. Denken Sie also daran. Es braucht eine Überprüfung.

Wettbewerb 3 PUBG Winner Prediction

Entspricht der PUBG Finish Placement Prediction von Kaggle (nur Kernel). PUBG ist ein Spiel, bei dem 100 Teilnehmer zum Battle Royale auf die Insel geschickt werden. Ich habe es versucht, aber ich habe es einfach getötet. Zuerst habe ich Leute, die oft spielen, gebeten, mir zu zeigen, wo sie Spiele spielen. Es scheint, dass der entscheidende Faktor im Spiel ist, wie man Gegenstände, Fahrzeuge und Waffen einsetzt und wie man sich in die immer enger werdende Sicherheitszone schleicht. Ich habe jedoch keine Ahnung, wie ich die Stärke des Spiels codieren soll. Kaggle veröffentlicht viele Vorhersagen als Notizbuch. Es gab viele maßstabsgetreue Ansätze aus den Augen. Maschinelles Lernen entwickelt sich mit enormer Geschwindigkeit. Als ich eine Kombination starker Codes einreichte, bekam ich eine gute Punktzahl.

Einheit 7 (2/12) Modellüberprüfungsmethode und Abstimmungsmethode

Sie haben gelernt, wie Sie Modellparameter anpassen, verschiedene Modelle verwenden und Vorhersagen treffen, indem Sie mehrere Modelle kombinieren. Wenn Sie versuchen, es richtig zu machen, fallen Sie in das Präzedenzfallprinzip oder Sie entfernen es, weil Sie zu viel nachdenken, so dass das Bild etwas Asobi machen soll. Als ich dann eine Methode namens Bagging implementierte, die die Daten in mehrere Teile aufteilt und trainiert, wurde die Vorhersagegenauigkeit viel besser.

Der 8. (3/4) Data Scientist Der Weg zur Mittelstufe Wir haben Leute, die an vorderster Front aktiv sind, eingeladen, über die Site zu sprechen. Ich habe gelernt, wie man Daten für geschäftliche Themen wie Marketing verwendet und was die Leute über den Verkauf von Dingen denken sollen. Die Geschichte der Messung der Wirkung von CM war sehr interessant. Dann gab es tiefes Lernen, Algorithmen zum Ausführen von Python mit hoher Geschwindigkeit, Pyspark, SparkSQL und andere mathematische Methoden sowie Engineering-Tools. Letzte Ausgabe Vorschlag für ein Neugeschäft für Home Credit Lassen Sie uns die Daten von Home Credit, einem in Südostasien expandierenden Kreditunternehmen, analysieren und ein Neugeschäft vorschlagen. Unter Verwendung von Daten aus Kaggles Home Credit Default Risk im letzten Jahr verfolgt das Management einen anderen Ansatz, der sich des maschinellen Lernens nicht bewusst ist. Präsentieren. Da ich keine Ahnung davon habe, habe ich es geschafft, es einzureichen, da ich dachte, dass ich mit einer solchen Vorhersage unter Bezugnahme auf die 8. Vorlesung zufrieden sein würde. Abgeschlossen

Wenn ich auf diese Weise zurückblicke, bin ich beeindruckt, dass ich es gut geschafft habe. Ich bin allen Teilnehmern des Kurses für ihre großzügige Unterstützung dankbar.

In Corona wurden verschiedene Zeitpläne abgesagt, daher werde ich sie nach und nach überprüfen. GCI 2020 Summer wird im April erneut gestartet. Wenn Sie also an maschinellem Lernen interessiert sind, tun Sie dies bitte. es wird empfohlen!