[PYTHON] Empfehlung von Jupyter Notebook, einer Codierungsumgebung für Datenwissenschaftler

Data Scientist Artikel 2. ww

Datenanalyseumgebung für Datenwissenschaftler

Ich denke, dass Datenwissenschaftler viele Möglichkeiten haben, Präsentationen zu halten und zu diskutieren, während sie sich die Daten ansehen. <- Angemessene Spekulation Daher bin ich der Meinung, dass eine andere Codierungsumgebung als vim / emacs und die alte IDE erforderlich ist.

Ich denke, die folgenden vier Punkte sind erforderliche Spezifikationen.

Erforderliche Spezifikationen vim/emacs Rstudio/Spyder Spotfire/Tableu Jupyter Notebook
Kann codieren ×
Daten können interaktiv visualisiert werden ×
Einfache Gewährleistung der Reproduzierbarkeit ×
sexy Aus der Öffentlichkeit gesehen ×

Es ist eine willkürliche Tabelle, die weit von der Datenwissenschaft entfernt ist, aber es stimmt, dass die Verwendung von Jupyter Notebook keine Verluste verursacht. RStudio (Python ist Spyder) ist gut, aber unter dem Gesichtspunkt der Reproduzierbarkeit ist Jupyter Notebook, mit dem Sie Kommentare mit Abschriften hinterlassen können, besser. Es wird empfohlen, da Sie den Codierungsprozess auch dann speichern können, wenn Sie kein Datenwissenschaftler sind.

Was ist Jupyter Notebook?

――Python wird von Anfang an mit einer interaktiven Shell geliefert, aber Personen, die damit nicht zufrieden waren, haben eine interaktive Shell namens IPython (Interactive Python) erstellt.

--Zellenorientierte Codierung: Kann gemeinsam in Einheiten ausgeführt werden, die als Zellen bezeichnet werden --Tab Vervollständigung reservierter Wörter, Variablen, Modulnamen usw.

  • Objekte untersuchen: Zum Objektnamen hinzufügen, um weitere Informationen zu erhalten
  • Verschiedene magische Befehle: Überprüfen Sie die Ausführungsgeschwindigkeit mit %% timeit usw. --Shell-Befehle: Zeilen, die mit! Beginnen, wie z. B. ! Ls, können als Shell-Befehle ausgeführt werden
  • Wiederverwendung von Ein- und Ausgängen: Zelleneingänge und -ausgänge werden in Variablen namens In und Out gespeichert

als Ergebnis,

** Es handelt sich um eine Anwendung, die Reproduzierbarkeit, Speicherung und gemeinsame Nutzung des Analyseprozesses ermöglicht **. Es ist eine Art elektronische Versuchsnotiz. (Es gibt keinen Zeugen)

Umgebung

Wenn Sie Anakonda setzen, ist alles enthalten. Die Umgebungskonstruktion von Anaconda finden Sie unter hier.

Starten Sie das Terminal in einem geeigneten Ordner und drücken Sie den folgenden Befehl. jupyter notebook Es ist in Ordnung, wenn der Browser gestartet wird und die Jupyter-Seite unter "http: // localhost: 8888" angezeigt wird.

Jupyter Grundeinstellungen

Alter Artikel Integration


Es funktioniert vorerst auch dann, wenn Sie es nicht einstellen. Wenn es Ihnen nichts ausmacht, überspringen Sie es bitte.


alias jupyter notebook ist ziemlich lang, so dass Sie note oder alias machen können.

Über config

Es scheint, dass sich der Konfigurationsbereich in Jupyter 4.0 erheblich geändert hat, daher sollten diejenigen, die ihn schon lange verwenden, ihn überprüfen. https://jupyter.readthedocs.org/en/latest/migrating.html

Erstellen einer Konfigurationsdatei und Festlegen eines Kennworts

Referenz-URL

jupyter notebook --generate-config
#>>> Writing default config to: ~/.jupyter/jupyter_notebook_config.py
python -c "from notebook.auth import passwd;print(passwd())" 
#>>> Enter password:
#>>> Verify password:
#>>> 'sha1:........'

Erstellen Sie eine Kopie des Hash-Passworts, das mit sha1: ... beginnt.

vi ~/.jupyter/jupyter_notebook_config.py

Hauptänderungen

Suchen Sie die folgenden Parameter und kommentieren Sie sie gegebenenfalls aus.

Parameter Ursprünglicher Wert Kommentar
c.NotebookApp.ip 'localhost' Ändern Sie, ob Sie von anderen Client-Computern aus zugreifen möchten.'*'Vollständig geöffnet.
c.NotebookApp.notebook_dir null Geben Sie das aktuelle Verzeichnis von Jupyter an. Es ist gut, es irgendwo anzugeben.
c.NotebookApp.open_browser True Möchten Sie den Browser beim Start öffnen? Setzen Sie den Server ohne X auf False.
c.NotebookApp.port 8888 Wenn Sie 8888 an anderer Stelle verwenden, geben Sie einen anderen Port an.
c.NotebookApp.password null Wenn Sie die zuvor kopierte Hash-Zeichenfolge eingeben, wird die Kennwortauthentifizierung angewendet.

Es gibt auch andere SSL-Einstellungen. Überprüfen Sie daher die Dokumentation, wenn Sie im Web veröffentlichen müssen.

Bibliothek, die beim Start von IPython geladen werden soll

Wenn Sie die Bibliothek beschreiben, die zuerst in ~ / .ipython / profile_default / startup geladen werden soll, wird sie beim Start des Kernels zusammen gelesen. Zellmagie kann auch im ipy-Format beschrieben werden, daher ist es gut, auch% matplotlin inline zu beschreiben. Wenn Sie [die Lieblingsschreibweise von seaborn] schreiben (http://nkmk.github.io/blog/python-seaborn-matplotlib/), wird es danach einfacher. Wenn Sie zu viel schreiben, wird der Start des Kernels verzögert, was frustrierend ist. (Pandas sind relativ schwer)

Beispiel:

00_init.ipy


%matplotlib inline
from matplotlib import pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd

extension Jupyter Notebookn hat auch eine Erweiterung. Ich werde es weglassen, weil es im folgenden Artikel zusammengefasst ist. Fügen Sie eine Erweiterung hinzu, um eine komfortablere Jupyter-Umgebung zu erstellen [jupyter notebook extensions python-markdown(markdown + jinja2)] (http://qiita.com/ksomemo/items/ba0f24daae2276ffd9b2)

RISE

Es gibt eine coole Erweiterung, mit der Sie auf Ihrem Jupyter-Notebook präsentieren können.

git clone https://github.com/damianavila/RISE
cd RISE
python setup.py install

Oben rechts auf der Notebook-Seite wird eine Diashow-Schaltfläche hinzugefügt

Jupyter Content Management Extensions

pip install jupyter_cms
jupyter cms install --user -s 
jupyter cms activate
jupyter notebook

(3/21 Nachschrift) Ich habe vergessen, dass IBM eine super bequeme Erweiterung gemacht hat. Wenn Sie dies eingeben, können Sie von jupyter aus eine Volltextsuche in der Notizbuchdatei durchführen. IBM Einführungsblog Es wird auf pip veröffentlicht und ist daher einfach zu installieren. Wenn Sie das Notizbuch nach der Aktivierung von "jupyter cms" starten, wird dem Baumbildschirm eine Suchschaltfläche hinzugefügt. Sie können auch nach untergeordneten Codes und Kommentaren suchen, wodurch die Wiederverwendbarkeit verbessert wird. Die Suche ist auch sehr flexibel (http://whoosh.readthedocs.org/en/latest/querylang.html). (Ich würde mich mehr freuen, wenn es eine Vorschau gäbe ...)

Darüber hinaus gibt es auch Erweiterungen, mit denen Sie Dashboards mit Jupyter Notebook erstellen können. JupyterDay NYC Folie github

(3/21 Nachtrag bisher)

So verwenden Sie Jupyter Notebook

Es gibt einen guten Artikel. Jupyter Beginning

(Hinzugefügt am 13. April 2016) Geben Sie jupyter_environment_kernels ein, um die Umgebung zu wechseln. Ich habe es in einem wunderbaren Artikel [hier] herausgefunden (http://qiita.com/yoppe/items/38005f415a5b8b884c7d).

Recommended Posts

Empfehlung von Jupyter Notebook, einer Codierungsumgebung für Datenwissenschaftler
<Python> Erstellen Sie einen Server für die Datenanalyse mit Jupyter Notebook
Datenanalyse zur Verbesserung von POG 2 ~ Analyse mit Jupiter-Notebook ~
Bereiten Sie eine Programmiersprachenumgebung für die Datenanalyse vor
Angeben des Jupyter Notebook-Browsers in einer Windows-Umgebung
Eine Bibliothek für Datenwissenschaft "Ich möchte das tun" auf dem Jupyter Notebook
Empfehlung zum Erstellen einer tragbaren Python-Umgebung mit conda
Liste der Python-Bibliotheken für Datenwissenschaftler und Dateningenieure
Tastenkombination für Jupyter-Notebook
Dockerfile zum Erstellen einer datenwissenschaftlichen Umgebung basierend auf pip3
Ich möchte eine virtuelle Umgebung mit Jupyter Notebook verwenden!
jupyter notebook in python3.8 venv umgebung
Erstellen und testen Sie eine CI-Umgebung für mehrere Versionen von Python
Aufbau einer Python-Umgebung für diejenigen, die Datenwissenschaftler 2016 werden möchten
Protokolldatei mit Job (Notizbuch) von Cloud Pak for Data ausgeben
Erstellen Sie mit PsychoPy + Jupyter Notebook eine komfortable Umgebung für psychologische Experimente / Analysen
Erstellen Sie ein USB-Boot-Ubuntu mit einer Python-Umgebung für die Datenanalyse
Snippet-Einstellungen für Python Jupyter Notebook
Jupyter Notebook unerlässlich für die Softwareentwicklung
Post Jupyter Notebook als Blog-Beitrag
Machen Sie einen Sound mit Jupyter Notebook
[MEMO] [Aufbau der Entwicklungsumgebung] Jupyter Notebook
Empfohlene Wettbewerbsseite für Datenwissenschaftler
Errichtete eine Umgebung für Anaconda & Jupyter
Empfehlung zur Datenanalyse mit MessagePack
Ermöglichen Sie Jupyter Notebook, Audiodaten zur Wiedergabe in HTML-Tabellen einzubetten
Machen wir die COBOL-Entwicklungsumgebung komfortabel 3 - Empfehlung für die Automatisierung von Hilfsarbeiten-
Python-E-Book-Zusammenfassung nützlich für die frei lesbare Datenanalyse
Eine Geschichte von einer Person, die von Anfang an auf Datenwissenschaftler abzielte
Grundeinstellung des Jupyter-Notizbuchs für Vim-Liebhaber ・ Beenden mit jj (jupyter-vim-Bindung)
Erstellen Sie schnell eine Python-Umgebung für Deep Learning / Data Science (Windows)
Jupyter Notebook-Erweiterung, nbextensions-Einstellungen für mich
Machen wir einen Jupyter-Kernel
Erstellen wir eine virtuelle Umgebung für Python
Machen Sie Jupyter Notebook zu einem Dienst unter CentOS
Eindrücke von der Verwendung von Flask für einen Monat
Erstellen Sie eine Ausführungsumgebung für Jupyter Lab
[Mac] Erstellen einer virtuellen Umgebung für Python
PC-GPU-Prüfung am Jupyter-Notebook
Jupyter Notebook Grundlagen der Verwendung
Erstellen einer Conda-Umgebung für ROS-Benutzer
Empfehlung von Altair! Datenvisualisierung mit Python
Bau einer Entwicklungsumgebung für die Choreonoid-Werkstatt
Führen Sie Jupyter Notebook auf einem Remote-Server aus
Erstellen einer Python-Entwicklungsumgebung für die KI-Entwicklung
Erstellen einer Entwicklungsumgebung für maschinelles Lernen
[Einführung in Data Scientist] Grundlagen von Python ♬
Ein Memorandum über Probleme beim Formatieren von Daten
Einführung des Zeichnungscodes für Figuren mit einem gewissen Grad an Perfektion der Wetterdaten
Führen Sie die API des Cloud Pak für Datenanalyseprojekts Job mit Umgebungsvariablen aus
So geben Sie mit Jupyter Notebook einen Wert in der Mitte einer Zelle aus
Ein Memorandum zur Ausführung des Befehls! Sudo magic in Jupyter Notebook
Installieren Sie Jupyter Notebook und stellen Sie es so ein, dass eine Umgebung zum Erstellen von Studiennotizen erstellt wird [Mac]
Erstellen Sie eine PYNQ-Umgebung auf Ultra96 V2 und melden Sie sich bei Jupyter Notebook an
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
[Einführung in Python] So erhalten Sie den Datenindex mit der for-Anweisung