Führen Sie Apache-Spark auf IPython Notebook aus

Hintergrund

Ich interessiere mich für Big Data, Echtzeitanalyse, Data Mining, maschinelles Lernen und jeder schreibt und spricht auf unterhaltsame Weise über Blogs. Das klingt interessant. Es ist nur so, dass ich persönlich interessiert bin und recherchiere. Ich bin weniger als ein Bösewicht, also genieße ich, was ich auf dem nächsten Level mache.

Dinge die zu tun sind

Sie müssen lediglich Apache-Spark einrichten, um es Ihrem IPython-Notebook zu verleihen. Wenn Sie es googeln, werden verschiedene Dinge herauskommen, aber ich möchte es für mich behalten, also machen Sie sich eine Notiz. Wie ich zuvor erfahren habe, wurde Spark 1.2.0 veröffentlicht, es ist also schon etwas alt. Aber ich denke es ist trotzdem dasselbe.

Annahme

Umgebung

Verfahren

  1. Laden Sie Spark herunter und kopieren oder installieren Sie es irgendwo

Screenshot 20.12.2014 23.26.53.png

Bei der Installation mit Homebrew scheint es sich in "/ usr / local / Cellar / apache-spark / 1.1.1" zu befinden.

  1. Setzen Sie die Umgebungsvariable auf "SPARK_HOME"

    export SPARK_HOME="Ordner, in dem der Funke entpackt wurde"
    
  2. Erstellen Sie ein IPython-Profil

    $ ipython profile create pyspark
    
  3. Bearbeiten Sie das IPython-Umgebungsprofil startup / 00-pyspark-setup.py

    #coding:utf-8
    import os
    import sys
    
    os.environ['SPARK_HOME'] = '/usr/local/Cellar/apache-spark/1.1.1'
    spark_home = os.environ.get('SPARK_HOME', None)
    if not spark_home:
        raise ValueError('SPARK_HOME environment variable is not set')
    sys.path.insert(0, os.path.join(spark_home, 'libexec/python'))
    sys.path.insert(0, os.path.join(spark_home, 'libexec/python/lib/py4j-0.8.2.1-src.zip'))
    execfile(os.path.join(spark_home, 'libexec/python/pyspark/shell.py'))
    

In meiner Umgebung befindet sich die Konfigurationsdatei in ~ / .ipython / profile_pyspark. Schreiben wir py4j-0.8.2.1-src.zip neu, da dies von der Version abhängt. In Windows war es meiner Meinung nach um den Benutzerordner.

  1. Versuchen Sie zu starten

    $ ipython notebook --profile=pyspark
    
  2. Es fühlt sich an, als würde sich etwas bewegen. Nein!

Cree.png

Referenz

http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/

Recommended Posts

Führen Sie Apache-Spark auf IPython Notebook aus
Parallele Berechnung mit iPython Notebook
Spielen Sie mit Jupyter Notebook (IPython Notebook)
Führen Sie IPython Notebook auf Docker aus
Diagrammzeichnung mit IPython Notebook
Verwenden von Bokeh mit IPython Notebook
Forschungs- und Entwicklungsleben mit iPython Notebook
Erstellen Sie eine IPython Notebook-Umgebung mit boot2docker
Verwenden von Apache Spark mit Jupyter Notebook (IPython Notebook)
HTML-Präsentation "LIVE" mit IPython 3.0.0-dev, IPython Notebook
ipython notebook Installation
IPython Notebook-Empfehlungen
Reichhaltige Zellenausgabe mit Jupyter Notebook (IPython)
So debuggen Sie mit Jupyter oder iPython Notebook
Grafikzeichnung mit Jupyter (Ipython-Notizbuch) + Matplotlib + Vagabund
Erstellen Sie eine Tabelle mit IPython Notebook
Führen Sie Python mit VBA aus
Führen Sie prepDE.py mit python3 aus
Führen Sie Blender mit Python aus
Starten Sie IPython mit virtualenv
Erstellen Sie Folien mit iPython
Verbinden Sie das IPython-Notebook aus der Ferne
Führen Sie iperf mit Python aus
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
EC2-Bereitstellung mit Vagrant + Jupyter (IPython Notebook) auf Docker
[Maschinelles Lernen] Starten Sie Spark mit iPython Notebook und probieren Sie MLlib aus
Ich möchte R-Funktionen einfach mit ipython notebook verwenden
[IPython] Freigeben eines IPython-Notizbuchs
Bei Verwendung von optparse mit iPython
Führen Sie Python mit PyCharm aus (Windows)
Verwenden von Graphviz mit Jupyter Notebook
Berühre Flask + laufe mit Heroku
Führen Sie Python mit CloudFlash aus (arm926ej-s)
Verwenden Sie pip mit Jupyter Notebook
Anzeigen von Zeichenfolgen in IPython Notebook
Verwenden Sie Cython mit Jupyter Notebook
Um gym_torcs mit ubutnu16 auszuführen
Führen Sie Label mit tkinter [Python] aus.
Starten Sie den IPython-Notebook-Server
Führen Sie Jupyter Notebook unter Windows aus
Laden Sie die Django-Shell mit ipython neu
Ermöglichen Sie externe Verbindungen mit dem Jupiter-Notebook
Formatieren mit autopep8 auf Jupyter Notebook
Visualisieren Sie den Entscheidungsbaum mit einem Jupyter-Notizbuch
Machen Sie einen Sound mit Jupyter Notebook
Skriptausführung beim Start mit ipython
Führen Sie Rotrics DexArm mit der Python-API aus
Führen Sie die App mit Flask + Heroku aus
Führen Sie mruby mit Python oder Blender aus
Führen Sie SwitchBot mit Bleak unter Windows 10 aus
Führen Sie das Skript mit dem Befehl admin von Django aus
Führen Sie Aprili von Python auf Orange aus
Führen Sie python3 Django1.9 mit mod_wsgi aus (deploy)
Verwenden von Japanisch mit Rodeos IPython @ Windows
Fügen Sie mit Jupyter Notebook weitere Kernel hinzu
Bequeme Analyse mit Pandas + Jupyter Notebook
Notizen zur Stapelverarbeitung in IPython Notebook
Bis Python auf Apache läuft