[PYTHON] Wenn Sie sich für Datenwissenschaftler interessieren, schauen Sie sich zuerst hier um, eine Zusammenfassung der Literatur und Videos (nach Bedarf hinzugefügt).

Einführung

Ziel dieses Artikels

** "Ich habe in letzter Zeit viel über" Datenwissenschaftler "und" Statistik "gehört und bin interessiert, aber ehrlich gesagt bin ich mit diesem Bereich nicht so vertraut. Wo soll ich also anfangen?" ** Es ist ein Artikel für Menschen gezeichnet.

Mit anderen Worten, es ist ein Artikel, den ich vor X Jahren gedacht hätte "Ich wünschte ich hätte".

Daher veröffentliche ich keine Bücher, in denen verrückte Inhalte erwähnt werden, die die Menschen glücklich machen: "Ich bin ein knuspriger Datenwissenschaftler."

** "Es gibt keine PRML ... Ist es der Grundschlüssel, bist du Moguri?" ** Wenn Sie das denken, erhalten Sie es möglicherweise nicht aus diesem Artikel.

Dieser Artikel richtet sich an Anfänger.

[Bitte auch hier] ・ Es ist Zeit, ernsthaft über die Definition und die Fähigkeiten von Datenwissenschaftlern nachzudenken. http://qiita.com/hik0107/items/f9bf14a7575d5c885a16

Wie man diesen Artikel liest

Es ist in drei Teile unterteilt: "Einführung", "Programmierung" und "Statistisches Modell / maschinelles Lernen". Ich hoffe, Sie können es sehen, wo Sie interessiert sind.

Da es für Anfänger gedacht ist, habe ich auch versucht, die "Leichtigkeit der Anhaftungsrate" für jede Informationsquelle nach eigenem Ermessen zu ermitteln.

★ ☆☆☆☆: Schwierig für Anfänger ★★★★★: Auch für Anfänger ist es einfach, mit ihnen auszukommen     Darüber hinaus wird dieser Satz nach freiem Ermessen angemessen festgelegt. Es gibt keine strenge Grundlage. Diese Rate hat auch nichts mit der Qualität der Informationen zu tun.

Bis zuletzt ist das Kriterium, ob ich es als Anfänger gesehen habe oder nicht. Ich dachte: "Es ist ein wenig schwierig, mit ... auszukommen." Bitte beachten Sie als Referenz.

Hinweise zu diesem Artikel

Die Informationen im Artikel können sich gegebenenfalls ändern. Insbesondere in Bezug auf die Hinzufügung gibt es viele Quellen, die noch nicht geschrieben wurden, daher planen wir, sie einzeln hinzuzufügen.

1. Einleitung

Bücher

O'Reilly: Data Science Lecture http://goo.gl/rZqhE5

★★★☆☆ Es ist als Einführung ziemlich gut organisiert. Ein Buch, das alles von der aktuellen Situation um Datenwissenschaftler bis hin zu statistischen Modellen und praktischen Arbeiten abdeckt. Wenn Sie über Mindestkenntnisse im Bereich Datenanalyse verfügen, sollten Sie dieses Buch zuerst lesen.

Diese Mathematik bestimmt die Strategie http://goo.gl/Rkd5q

★★★★★ Es ist kein Studienbuch, sondern ein Lesematerial ... Ein Buch mit Beispielen für die Verwendung von Daten und statistischen Modellen in verschiedenen Bereichen, von Wein über Kriminalität, Marketing bis hin zu Filmen. Der Autor ist Universitätsprofessor, daher ist das Sammeln von Fallstudien nicht ungewöhnlich.

Sexy Little Numbers http://goo.gl/DMOKrs

★★★★★ Es kann ein wenig anders sein als das Bild eines Datenwissenschaftlers, das in der Welt gesagt wird. Es ist jedoch ein Buch, das uns lehrt, dass manchmal eine große Datenmenge oder ein schwieriges statistisches Modell für eine aussagekräftige Analyse für Unternehmen möglicherweise nicht erforderlich sind.

O'Reilly: Schöne Daten http://goo.gl/LNvaUW

★★☆☆☆ Eine Sammlung von Beispielen, wie die Daten in welchen Feldern angewendet werden Etwas über Facebook-Datenwissenschaftler, Inhalte, die Menschen, die es mögen, gefallen werden

Video

schoo: Datenanalysekurs, der vor Ort eingesetzt werden kann https://schoo.jp/teacher/184

★★★★★ Herr Yoshinaga, ein Datenwissenschaftler von Recruit Communications, wird einen Vortrag über die Praxis der Datenanalyse halten.

gacco: Data Science Kurs für Berufstätige http://gacco.org/stat-japan/

★★★★☆ Es ist dünn und breit, daher ist es ein guter Ort, um es als ersten Eintrag anzusehen. Der berühmte Professor Nishiuchi, der "die stärkste Studie = Statistik" erklärte, ist ebenfalls erschienen.

Blog

Blog eines Datenwissenschaftlers, der in Ginza arbeitet http://tjo.hatenablog.com/

★★★☆☆ Dies ist der Blog von "T.J.Ozaki-san", der in der Datenwissenschaftlerbranche berühmt ist. Es gibt eine beträchtliche Menge an Informationen, aber da es sich um ein Blog handelt, werden diese nicht systematisch geschrieben. Daher ist es möglicherweise besser zu lernen, wie Sie die Artikel lesen, die Ihnen wichtig sind, während Sie sie von jemandem mit etwas Wissen scannen.   Ich denke jedoch, dass selbst Anfänger solche Artikel leicht lesen können, da sie nicht nur Modelle und Programmierung, sondern auch den Fluss der Branche berühren.

2. Programmierung (Python, R)

Bücher

Einführung in die Datenanalyse mit Python-Datenverarbeitung mit Numpy und Pandas http://goo.gl/YflT0M

★★★☆☆ Erfahren Sie mehr über Pandas und Numpy, wichtige Tools für die Analyse mit Python

Bücher

Programmierung kollektiver Intelligenz https://www.oreilly.co.jp/books/9784873113647/

★★☆☆☆ Lernen Sie, während Sie typische Algorithmen für maschinelles Lernen in Python implementieren Weil es für Leute ist, die Python in gewissem Umfang verwenden können und Grundkenntnisse über Algorithmen haben Beide Programmierungen / Algorithmen sind möglicherweise nicht als erstes Lernbuch geeignet

Video

Udacity: Intro to Data Science http://edmaps.co/udacity/course/ud359.html

★★★☆☆ Lernen Sie während einer Einführung in die Datenwissenschaft die Datenoperationen in Python mit Codierungstests kennen.

Udacity: Data Analysis with R http://edmaps.co/udacity/course/ud651.html

★★★☆☆ R-Klasse

Webseite

Doshisha Data Science Laboratory http://www1.doshisha.ac.jp/~mjin/R/index.html

★★★☆☆ Mit R können Sie eine breite Palette von Grundlagen der Statistik bis hin zu Modellen der Statistik / des maschinellen Lernens lernen. Wenn Sie Zeit haben und R verwenden möchten, können Sie es umfassend lernen.

Technische Überprüfung Beginnen wir mit dem maschinellen Lernen http://gihyo.jp/dev/serial/01/machine-learning

★★☆☆☆ Sie können einfache Algorithmen für maschinelles Lernen in Python implementieren. Es ist gut, fortzufahren und den theoretischen Hintergrund usw. zu erklären.

Andere (Dies ist der Stemmer meines Beitrags)

Eine rudimentäre Zusammenfassung der Datenmanipulation in Python Pandas http://qiita.com/hik0107/items/d991cc44c2d1778bb82e

Datenanalyse in Python Zusammenfassung der Quellen, die Anfänger zuerst betrachten sollten http://qiita.com/hik0107/items/0bec82cc09d0e05d5357

Wunderschönes Zeichnen mit Python-Seaborn erleichtert die Datenanalyse und -visualisierung http://qiita.com/hik0107/items/3dc541158fceb3156ee0

Ergänzung

In Bezug auf Programme ist es besser, SQL, Linux, Hadoop usw. zu verwenden. Ich kenne hier keine gute systematische Informationsquelle, weil ich so chaotisch gelernt habe. Wenn Sie Empfehlungen haben, lassen Sie es mich bitte wissen m (_ _) m

3. Statistisches Modell, maschinelles Lernen

Bücher

Eine Einführung in die statistische Modellierung für die Datenanalyse http://goo.gl/mrX8vD Als Ergänzung http://hosho.ees.hokudai.ac.jp/~kubo/ce/NiigataiLecture2015.html Es ist möglicherweise einfacher zu verstehen, wenn Sie fortfahren, während Sie es betrachten (Der Link führt zu der Seite, auf der sich das Handout des Autors befindet.)

★★☆☆☆ Sie können die Grundlagen statistischer Modelle und verallgemeinerter linearer Modelle systematisch von Grund auf lernen. Irgendwann werden wir über GLMM (gemischtes Modell) und MCMC sprechen, aber ich denke, wir sollten einmal bis GLM lernen. Für ein Buch dieser Art ist es sehr einfach, sich zurechtzufinden, da es eine grobe Erzählung hat und sich nicht um Strenge kümmert.

Es ist im Volksmund als "Midoribon" bekannt, und es finden auch Lesesitzungen statt. Audio- und Videoerklärungen werden ebenfalls hochgeladen, daher ist es möglicherweise besser für Personen, die nicht in der Lage sind, diese Informationen alleine zu lernen. https://www.youtube.com/watch?v=nD3V4ovqr1A

Schonende Statistik von R. http://goo.gl/RJDzI

★★★★☆ Ein Buch zum Erwerb von Grundkenntnissen in Statistik beim Schreiben von Code in R. Es ist gut, gleichzeitig Codierung und Statistik lernen zu können

Video

Coursera: Machine Learning https://www.coursera.org/learn/machine-learning

★★★☆☆ Eine Schildklasse, die im Online-Kurs Coursera sehr beliebt ist Stanfords Andrew Ng Klasse für maschinelles Lernen. Die Erklärung ist höflich und für Anfänger zu empfehlen Der Unterricht findet auf Englisch statt, aber Sie können sicher sein, dass es japanische Untertitel gibt.

Hierarchie Bayes und MCMC Kommentar https://www.youtube.com/watch?t=5&v=wO8jd0z5YRQ

★☆☆☆☆ Ein Video, in dem Professor Kubo, der Autor der oben vorgestellten "Einführung in die statistische Modellierung für die Datenanalyse", das hierarchische Bayes'sche Modell selbst erklärte. Es kann sehr effektiv sein, wenn Sie zusammen mit dem Hauptteil des Buches lernen

Webseite

Teradata Marketing Analytics http://goo.gl/t3JoMx

★★★★☆ Eine Website mit detaillierten Informationen zum im Marketingbereich verwendeten Data Mining-Modell Es ist wirklich schön, dass diese Menge an Informationen völlig kostenlos ist

Technische Überprüfung Maschinelles Lernen Beginnen wir http://gihyo.jp/dev/serial/01/machine-learning

★★☆☆☆ Implementiert in Python, während Sie einen Überblick über maschinelles Lernen erhalten Ideal für Leute, die lernen möchten, während sie ihre Hände bewegen (und Python ein wenig verwenden können)

Kaggle Titanic Tutorial http://kagglechallenge.hatenablog.com/entry/2015/02/13/193155

★★★★☆ Ein Tutorial zum Erstellen eines Vorhersagemodells von Grund auf neu basierend auf der berühmten "Titanic Passenger Survival Prediction" auf der Datenwettbewerbs-Website Kaggle. Ich bin froh, dass es in Excel, Python und R verfügbar ist.

Recommended Posts

Wenn Sie sich für Datenwissenschaftler interessieren, schauen Sie sich zuerst hier um, eine Zusammenfassung der Literatur und Videos (nach Bedarf hinzugefügt).
Wenn Sie einen Singleton in Python möchten, stellen Sie sich das Modul als Singleton vor
Datenanalyse in Python Zusammenfassung der Quellen, die Anfänger zuerst betrachten sollten
Selbst wenn Sie ein Python-Anfänger sind und weniger als ein Jahr Pferderennen haben, konnten Sie ein Triple gewinnen.
Wenn Sie eine Methode in einer Ruby-Klasse definieren und dann eine Methode darin definieren, wird sie zu einer Methode der ursprünglichen Klasse.
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden