[Update] Es gibt einen weiteren Artikel über die aktualisierte Version der Jupyter 5-Serie.
IPython ist seit Version 4.0 in Project Jupyter integriert. Jupyter kann nicht nur von Python, sondern auch von R, Julia und Scala verwendet werden und kann als das Kernwerkzeug für die Datenanalyse bezeichnet werden. Es kann nicht nur aus über 40 Programmiersprachen verwendet werden, sondern auch die Zusammenarbeit fördern und über den Jupyter Notebook Viewer (http://nbviewer.jupyter.org/) in Apache Spark integrieren. Es unterscheidet sich von der Generation, die IPython Notebook verwendet, und meint, ich sollte SciPy Stack für einen Moment ausprobieren.
Bisher schien es schwierig zu sein, NumPy und pandas zu installieren, aber Jupyter hat mehrere Sie haben ein Docker-Image vorbereitet, damit Sie es relativ einfach ausprobieren können. Wenn Sie es in Ihrem Browser vervollständigen möchten, können Sie es sofort auf der Website Try Jupyter! ausprobieren.
Starten Sie den Notebook-Server mit dem offiziellen Docker-Image. Grundsätzlich ist jupyter / datascience-notebook gut, aber wenn Sie Spark verwenden, [jupyter / all-spark-] Notizbuch](https://hub.docker.com/r/jupyter/all-spark-notebook/) oder jupyter / pyspark-notebook Entweder /) wäre besser. Viele Pakete sind auf dem Image vorinstalliert, was ungefähr 4,5 GB entspricht. Es ist eine gute Idee, sich die installierten Pakete anzusehen, während Sie auf den Download warten.
$ docker pull jupyter/datascience-notebook
$ docker images jupyter/datascience-notebook
REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE
jupyter/datascience-notebook latest 8e21bfc3eeba 11 hours ago 4.592 GB
Starten Sie den Container über Port 8888.
$ docker run -d --name notebook -p 8888:8888 jupyter/datascience-notebook
Wenn Sie mit einem Browser darauf zugreifen, sehen Sie die Benutzeroberfläche, die sauberer aussieht als IPython Notebook. Wenn Sie auf "Neu" klicken, werden Sie möglicherweise durch das Erscheinen mehrerer Optionen mehr begeistert sein.
Obwohl Python auf verschiedene Arten verwendet werden kann, wird es unter dem Gesichtspunkt der Umleitung vorhandener Assets der Mainstream sein. Stellen Sie sicher, dass die verschiedenen Python 3-Module verfügbar sind. Zeichnen wir zunächst eine Sin / Cos-Kurve mit Bokeh.
Als nächstes erhalten wir den Nikkei-Durchschnitt mithilfe des Pandas-Moduls von der Yahoo! API. Stellen Sie außerdem sicher, dass die Zeichen nicht verstümmelt sind, auch wenn für die Achse des Diagramms Japanisch verwendet wird.
Ich denke, RStudio ist einfacher zu verwenden, wenn Sie R normal schreiben. Wenn Sie jedoch die Möglichkeit in Betracht ziehen, Notebooks mit Teams zu teilen und Cluster auf der Serverseite zu bilden, ist es besser, mit der Verwendung von Jupyter vertraut zu sein. Man kann sagen, dass es gut ist. Es ist auch nützlich, um Umgebungsunterschiede zu absorbieren, z. B. ob ein Paket installiert ist oder nicht oder ob es je nach Umgebung installiert werden kann oder nicht.
Wenn Sie den Kernel wechseln, wechselt auch das Logo oben rechts. Ich denke, dies ist eine nützliche Funktion beim Hin- und Herwechseln zwischen mehreren Umgebungen.
Ich weiß nicht, ob es sich um ein Jupyter-Notizbuch oder ein IPython-Notizbuch handelt, aber Sie können auch Datendateien hochladen. Beim Start über Docker kann es schwierig sein, eine Verknüpfung mit dem Datencontainer herzustellen. Sie können jedoch die Schaltfläche "Hochladen" verwenden, um Daten hochzuladen, die sich in Ihrem lokalen Dateisystem befinden. Natürlich ist es auch nützlich, wenn Client und Server auf unterschiedlichen Computern ausgeführt werden.
Hochgeladene Dateien können von Notebooks in jeder Sprache angezeigt werden. Versuchen wir, Julia als Kernel zu verwenden und überprüfen Sie es. Es mag keinen großen Unterschied machen, aber die Sprachanzeige oben rechts ist Julia 0.3.2.
Druckvorschauen und Markdown-Downloads sind unabhängig von der Sprache des Kernels verfügbar. Es scheint nützlich zu sein, die Analyseergebnisse als einfachen Bericht aufzuzeichnen.
Sie können auch ein Terminal starten und das Paket installieren. Versuchen Sie beispielsweise, * xlsxwriter * mit pip
zu installieren.
Ich habe den Jupyter Notebook-Server mit dem offiziellen Docker-Image gestartet und überprüft, ob Python, R, Julia funktionieren. Das Herunterladen des Images dauert einige Zeit, aber ich denke, es ist sehr einfach zu installieren, ohne dass Probleme auftreten, die durch die Nichtübereinstimmung mehrerer Softwareversionen verursacht werden.
Es kann eine entmutigende Aufgabe sein, je nach den Fähigkeiten der Organisation und der Mitglieder oder der Analysemethode unterschiedliche Ausführungsumgebungen und Datenspeicher zu haben. Die Integration in Jupyter kann jedoch die Verwaltungskosten senken. Da das Ausgabeformat ebenfalls grob vereinheitlicht ist, scheint es als Aufzeichnungsmittel nützlich zu sein.
Recommended Posts