Data Scientist Artikel 2. ww
Ich denke, dass Datenwissenschaftler viele Möglichkeiten haben, Präsentationen zu halten und zu diskutieren, während sie sich die Daten ansehen. <- Angemessene Spekulation Daher bin ich der Meinung, dass eine andere Codierungsumgebung als vim / emacs und die alte IDE erforderlich ist.
Ich denke, die folgenden vier Punkte sind erforderliche Spezifikationen.
Erforderliche Spezifikationen | vim/emacs | Rstudio/Spyder | Spotfire/Tableu | Jupyter Notebook |
---|---|---|---|---|
Kann codieren | ◎ | ○ | × | ○ |
Daten können interaktiv visualisiert werden | × | ○ | ◎ | ○ |
Einfache Gewährleistung der Reproduzierbarkeit | △ | △ | × | ○ |
sexy | Aus der Öffentlichkeit gesehen × | ○ | ◎ | ◎ |
Es ist eine willkürliche Tabelle, die weit von der Datenwissenschaft entfernt ist, aber es stimmt, dass die Verwendung von Jupyter Notebook keine Verluste verursacht. RStudio (Python ist Spyder) ist gut, aber unter dem Gesichtspunkt der Reproduzierbarkeit ist Jupyter Notebook, mit dem Sie Kommentare mit Abschriften hinterlassen können, besser. Es wird empfohlen, da Sie den Codierungsprozess auch dann speichern können, wenn Sie kein Datenwissenschaftler sind.
――Python wird von Anfang an mit einer interaktiven Shell geliefert, aber Personen, die damit nicht zufrieden waren, haben eine interaktive Shell namens IPython (Interactive Python) erstellt.
--Zellenorientierte Codierung: Kann gemeinsam in Einheiten ausgeführt werden, die als Zellen bezeichnet werden --Tab Vervollständigung reservierter Wörter, Variablen, Modulnamen usw.
- Objekte untersuchen: Zum Objektnamen hinzufügen, um weitere Informationen zu erhalten
- Verschiedene magische Befehle: Überprüfen Sie die Ausführungsgeschwindigkeit mit
%% timeit
usw. --Shell-Befehle: Zeilen, die mit! Beginnen, wie z. B.! Ls
, können als Shell-Befehle ausgeführt werden- Wiederverwendung von Ein- und Ausgängen: Zelleneingänge und -ausgänge werden in Variablen namens In und Out gespeichert
als Ergebnis,
** Es handelt sich um eine Anwendung, die Reproduzierbarkeit, Speicherung und gemeinsame Nutzung des Analyseprozesses ermöglicht **. Es ist eine Art elektronische Versuchsnotiz. (Es gibt keinen Zeugen)
Wenn Sie Anakonda setzen, ist alles enthalten. Die Umgebungskonstruktion von Anaconda finden Sie unter hier.
Starten Sie das Terminal in einem geeigneten Ordner und drücken Sie den folgenden Befehl.
jupyter notebook
Es ist in Ordnung, wenn der Browser gestartet wird und die Jupyter-Seite unter "http: // localhost: 8888" angezeigt wird.
Alter Artikel Integration
Es funktioniert vorerst auch dann, wenn Sie es nicht einstellen. Wenn es Ihnen nichts ausmacht, überspringen Sie es bitte.
alias
jupyter notebook
ist ziemlich lang, so dass Sie note
oder alias machen können.
Es scheint, dass sich der Konfigurationsbereich in Jupyter 4.0 erheblich geändert hat, daher sollten diejenigen, die ihn schon lange verwenden, ihn überprüfen. https://jupyter.readthedocs.org/en/latest/migrating.html
jupyter notebook --generate-config
#>>> Writing default config to: ~/.jupyter/jupyter_notebook_config.py
python -c "from notebook.auth import passwd;print(passwd())"
#>>> Enter password:
#>>> Verify password:
#>>> 'sha1:........'
Erstellen Sie eine Kopie des Hash-Passworts, das mit sha1: ...
beginnt.
vi ~/.jupyter/jupyter_notebook_config.py
Suchen Sie die folgenden Parameter und kommentieren Sie sie gegebenenfalls aus.
Parameter | Ursprünglicher Wert | Kommentar |
---|---|---|
c.NotebookApp.ip | 'localhost' | Ändern Sie, ob Sie von anderen Client-Computern aus zugreifen möchten.'*'Vollständig geöffnet. |
c.NotebookApp.notebook_dir | null | Geben Sie das aktuelle Verzeichnis von Jupyter an. Es ist gut, es irgendwo anzugeben. |
c.NotebookApp.open_browser | True | Möchten Sie den Browser beim Start öffnen? Setzen Sie den Server ohne X auf False. |
c.NotebookApp.port | 8888 | Wenn Sie 8888 an anderer Stelle verwenden, geben Sie einen anderen Port an. |
c.NotebookApp.password | null | Wenn Sie die zuvor kopierte Hash-Zeichenfolge eingeben, wird die Kennwortauthentifizierung angewendet. |
Es gibt auch andere SSL-Einstellungen. Überprüfen Sie daher die Dokumentation, wenn Sie im Web veröffentlichen müssen.
Wenn Sie die Bibliothek beschreiben, die zuerst in ~ / .ipython / profile_default / startup
geladen werden soll, wird sie beim Start des Kernels zusammen gelesen.
Zellmagie kann auch im ipy-Format beschrieben werden, daher ist es gut, auch% matplotlin inline zu beschreiben.
Wenn Sie [die Lieblingsschreibweise von seaborn] schreiben (http://nkmk.github.io/blog/python-seaborn-matplotlib/), wird es danach einfacher.
Wenn Sie zu viel schreiben, wird der Start des Kernels verzögert, was frustrierend ist. (Pandas sind relativ schwer)
Beispiel:
00_init.ipy
%matplotlib inline
from matplotlib import pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
extension Jupyter Notebookn hat auch eine Erweiterung. Ich werde es weglassen, weil es im folgenden Artikel zusammengefasst ist. Fügen Sie eine Erweiterung hinzu, um eine komfortablere Jupyter-Umgebung zu erstellen [jupyter notebook extensions python-markdown(markdown + jinja2)] (http://qiita.com/ksomemo/items/ba0f24daae2276ffd9b2)
RISE
Es gibt eine coole Erweiterung, mit der Sie auf Ihrem Jupyter-Notebook präsentieren können.
git clone https://github.com/damianavila/RISE
cd RISE
python setup.py install
Oben rechts auf der Notebook-Seite wird eine Diashow-Schaltfläche hinzugefügt
Jupyter Content Management Extensions
pip install jupyter_cms
jupyter cms install --user -s
jupyter cms activate
jupyter notebook
(3/21 Nachschrift) Ich habe vergessen, dass IBM eine super bequeme Erweiterung gemacht hat. Wenn Sie dies eingeben, können Sie von jupyter aus eine Volltextsuche in der Notizbuchdatei durchführen. IBM Einführungsblog Es wird auf pip veröffentlicht und ist daher einfach zu installieren. Wenn Sie das Notizbuch nach der Aktivierung von "jupyter cms" starten, wird dem Baumbildschirm eine Suchschaltfläche hinzugefügt. Sie können auch nach untergeordneten Codes und Kommentaren suchen, wodurch die Wiederverwendbarkeit verbessert wird. Die Suche ist auch sehr flexibel (http://whoosh.readthedocs.org/en/latest/querylang.html). (Ich würde mich mehr freuen, wenn es eine Vorschau gäbe ...)
Darüber hinaus gibt es auch Erweiterungen, mit denen Sie Dashboards mit Jupyter Notebook erstellen können. JupyterDay NYC Folie github
(3/21 Nachtrag bisher)
Es gibt einen guten Artikel. Jupyter Beginning
(Hinzugefügt am 13. April 2016) Geben Sie jupyter_environment_kernels ein, um die Umgebung zu wechseln. Ich habe es in einem wunderbaren Artikel [hier] herausgefunden (http://qiita.com/yoppe/items/38005f415a5b8b884c7d).
Recommended Posts