[PYTHON] Versuchen Sie es mit Jupyters Docker-Image

[Update] Es gibt einen weiteren Artikel über die aktualisierte Version der Jupyter 5-Serie.


IPython ist seit Version 4.0 in Project Jupyter integriert. Jupyter kann nicht nur von Python, sondern auch von R, Julia und Scala verwendet werden und kann als das Kernwerkzeug für die Datenanalyse bezeichnet werden. Es kann nicht nur aus über 40 Programmiersprachen verwendet werden, sondern auch die Zusammenarbeit fördern und über den Jupyter Notebook Viewer (http://nbviewer.jupyter.org/) in Apache Spark integrieren. Es unterscheidet sich von der Generation, die IPython Notebook verwendet, und meint, ich sollte SciPy Stack für einen Moment ausprobieren.

Bisher schien es schwierig zu sein, NumPy und pandas zu installieren, aber Jupyter hat mehrere Sie haben ein Docker-Image vorbereitet, damit Sie es relativ einfach ausprobieren können. Wenn Sie es in Ihrem Browser vervollständigen möchten, können Sie es sofort auf der Website Try Jupyter! ausprobieren.

Starten Sie den Notebook-Server

Starten Sie den Notebook-Server mit dem offiziellen Docker-Image. Grundsätzlich ist jupyter / datascience-notebook gut, aber wenn Sie Spark verwenden, [jupyter / all-spark-] Notizbuch](https://hub.docker.com/r/jupyter/all-spark-notebook/) oder jupyter / pyspark-notebook Entweder /) wäre besser. Viele Pakete sind auf dem Image vorinstalliert, was ungefähr 4,5 GB entspricht. Es ist eine gute Idee, sich die installierten Pakete anzusehen, während Sie auf den Download warten.

$ docker pull jupyter/datascience-notebook
$ docker images jupyter/datascience-notebook
REPOSITORY                     TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
jupyter/datascience-notebook   latest              8e21bfc3eeba        11 hours ago        4.592 GB

Starten Sie den Container über Port 8888.

$ docker run -d --name notebook -p 8888:8888 jupyter/datascience-notebook

Wenn Sie mit einem Browser darauf zugreifen, sehen Sie die Benutzeroberfläche, die sauberer aussieht als IPython Notebook. Wenn Sie auf "Neu" klicken, werden Sie möglicherweise durch das Erscheinen mehrerer Optionen mehr begeistert sein.

スクリーンショット 2015-09-24 21.35.10.png

Python-Notizbuch

Obwohl Python auf verschiedene Arten verwendet werden kann, wird es unter dem Gesichtspunkt der Umleitung vorhandener Assets der Mainstream sein. Stellen Sie sicher, dass die verschiedenen Python 3-Module verfügbar sind. Zeichnen wir zunächst eine Sin / Cos-Kurve mit Bokeh.

スクリーンショット 2015-09-24 21.48.01.png

Als nächstes erhalten wir den Nikkei-Durchschnitt mithilfe des Pandas-Moduls von der Yahoo! API. Stellen Sie außerdem sicher, dass die Zeichen nicht verstümmelt sind, auch wenn für die Achse des Diagramms Japanisch verwendet wird.

スクリーンショット 2015-09-24 21.57.36.png

R Notizbuch

Ich denke, RStudio ist einfacher zu verwenden, wenn Sie R normal schreiben. Wenn Sie jedoch die Möglichkeit in Betracht ziehen, Notebooks mit Teams zu teilen und Cluster auf der Serverseite zu bilden, ist es besser, mit der Verwendung von Jupyter vertraut zu sein. Man kann sagen, dass es gut ist. Es ist auch nützlich, um Umgebungsunterschiede zu absorbieren, z. B. ob ein Paket installiert ist oder nicht oder ob es je nach Umgebung installiert werden kann oder nicht.

Wenn Sie den Kernel wechseln, wechselt auch das Logo oben rechts. Ich denke, dies ist eine nützliche Funktion beim Hin- und Herwechseln zwischen mehreren Umgebungen.

スクリーンショット 2015-09-24 22.23.46.png

Daten hochladen

Ich weiß nicht, ob es sich um ein Jupyter-Notizbuch oder ein IPython-Notizbuch handelt, aber Sie können auch Datendateien hochladen. Beim Start über Docker kann es schwierig sein, eine Verknüpfung mit dem Datencontainer herzustellen. Sie können jedoch die Schaltfläche "Hochladen" verwenden, um Daten hochzuladen, die sich in Ihrem lokalen Dateisystem befinden. Natürlich ist es auch nützlich, wenn Client und Server auf unterschiedlichen Computern ausgeführt werden.

スクリーンショット 2015-09-24 22.30.14.png

Hochgeladene Dateien können von Notebooks in jeder Sprache angezeigt werden. Versuchen wir, Julia als Kernel zu verwenden und überprüfen Sie es. Es mag keinen großen Unterschied machen, aber die Sprachanzeige oben rechts ist Julia 0.3.2.

スクリーンショット 2015-09-24 22.48.20.png

Druckvorschauen und Markdown-Downloads sind unabhängig von der Sprache des Kernels verfügbar. Es scheint nützlich zu sein, die Analyseergebnisse als einfachen Bericht aufzuzeichnen.

Paketinstallation

Sie können auch ein Terminal starten und das Paket installieren. Versuchen Sie beispielsweise, * xlsxwriter * mit pip zu installieren.

スクリーンショット 2015-09-24 23.11.53.png

Zusammenfassung

Ich habe den Jupyter Notebook-Server mit dem offiziellen Docker-Image gestartet und überprüft, ob Python, R, Julia funktionieren. Das Herunterladen des Images dauert einige Zeit, aber ich denke, es ist sehr einfach zu installieren, ohne dass Probleme auftreten, die durch die Nichtübereinstimmung mehrerer Softwareversionen verursacht werden.

Es kann eine entmutigende Aufgabe sein, je nach den Fähigkeiten der Organisation und der Mitglieder oder der Analysemethode unterschiedliche Ausführungsumgebungen und Datenspeicher zu haben. Die Integration in Jupyter kann jedoch die Verwaltungskosten senken. Da das Ausgabeformat ebenfalls grob vereinheitlicht ist, scheint es als Aufzeichnungsmittel nützlich zu sein.

Recommended Posts

Versuchen Sie es mit Jupyters Docker-Image
Generieren Sie ein Docker-Image mit Fabric
Versuchen Sie es mit Tkinter
Versuchen Sie es mit Docker-Py
Versuchen Sie es mit einem Ausstecher
Versuchen Sie es mit PDFMiner
Versuchen Sie es mit Geopandas
Versuchen Sie es mit Selen
Versuchen Sie es mit scipy
Versuchen Sie es mit pandas.DataFrame
Versuchen Sie es mit Django-Swiftbrowser
Versuchen Sie es mit matplotlib
Versuchen Sie es mit tf.metrics
Versuchen Sie es mit PyODE
Belichten Sie Ihr Docker-Image
Versuchen Sie es mit virtualenv (virtualenvwrapper)
[Azure] Versuchen Sie, Azure-Funktionen zu verwenden
Versuchen Sie es jetzt mit virtualenv
Bildsegmentierung mit U-Net
Versuchen Sie es mit W & B.
Versuchen Sie es mit Django templates.html
[Kaggle] Versuchen Sie es mit LGBM
Versuchen Sie es mit dem Feed-Parser von Python.
Versuchen Sie es mit Pythons Tkinter
Versuchen Sie es mit Tweepy [Python2.7]
Jupyter Docker Bildzusammenfassung
Versuchen Sie es mit Pytorchs collate_fn
Versuchen Sie, PythonTex mit Texpad zu verwenden.
[Python] Versuchen Sie, Tkinters Leinwand zu verwenden
Versuchen Sie es mit Scikit-Learn (1) - K-Clustering nach Durchschnittsmethode
Versuchen Sie die Funktionsoptimierung mit Hyperopt
Versuchen Sie es mit matplotlib mit PyCharm
Versuchen Sie es mit Azure Logic Apps
Versuchen Sie es mit Kubernetes Client -Python-
[Kaggle] Versuchen Sie es mit xg boost
Versuchen Sie es mit der Twitter-API
Versuchen Sie es mit OpenCV unter Windows
Probieren Sie die ähnliche Suche von Image Search mit Python SDK [Search] aus.
Versuchen Sie, Jupyter Notebook dynamisch zu verwenden
Versuchen Sie es mit AWS SageMaker Studio
Versuchen Sie, automatisch mit Selen zu twittern.
Vorhersage von Wolkenbildern mit convLSTM
Versuchen Sie es mit SQLAlchemy + MySQL (Teil 1)
Versuchen Sie es mit der Twitter-API
Versuchen Sie es mit SQLAlchemy + MySQL (Teil 2)
Versuchen Sie es mit der Vorlagenfunktion von Django
Versuchen Sie es mit der PeeringDB 2.0-API
Versuchen Sie es mit der Entwurfsfunktion von Pelican
Erstellen Sie eine GCE-Instanz aus einem GCR Docker-Image mithilfe von Terraform
Versuchen Sie es mit pytest-Overview und Samples-
Probieren Sie Selenium Grid mit Docker aus
Versuchen Sie, Jupyter Hub mit Docker zu erstellen
Versuchen Sie es mit Folium mit Anakonda
Versuchen Sie, ein neues Bild mit dem trainierten StyleGAN2-Modell zu bearbeiten
Docker ausprobieren: Erstellen Sie Ihr eigenes Container-Image für eine Python-Web-App
Erstellen und testen Sie mit Docker in wenigen Minuten eine OpenCV- und Python-Umgebung
Versuchen Sie es mit der Admin-API von Janus Gateway
[Statistik] [R] Versuchen Sie, die Teilungspunktregression zu verwenden.
Versuchen Sie es mit Spyder, das in Anaconda enthalten ist
Versuchen Sie es mit Designmustern (Exporter Edition)
Versuchen Sie, Tensorflow auf Docker + Anaconda auszuführen