Exécutez Apache-Spark sur le notebook IPython

Contexte

Je m'intéresse au big data, à l'analyse en temps réel, à l'exploration de données, à l'apprentissage automatique et tout le monde écrit et parle de blogs de manière amusante. Ça semble intéressant. Donc, c'est juste que je suis personnellement intéressé et que je recherche. Je suis moins qu'un méchant, alors j'apprécie ce que je fais au niveau suivant.

Choses à faire

Tout ce que vous avez à faire est de configurer Apache-Spark pour le prêter à votre notebook IPython. Si vous le recherchez sur Google, diverses choses sortiront, mais je veux le garder près de moi, alors prenez note. Comme je l'ai appris plus tôt, spark 1.2.0 est sorti, il est donc déjà un peu vieux. Mais je pense que c'est la même chose de toute façon.

supposition

environnement

procédure

  1. Téléchargez Spark et copiez-le ou installez-le quelque part

Capture d'écran 2014-12-20 23.26.53.png

Lorsqu'il est installé avec Homebrew, il sera placé dans / usr / local / Cellar / apache-spark / 1.1.1.

  1. Définissez la variable d'environnement sur SPARK_HOME

    export SPARK_HOME="Dossier où Spark a été décompressé"
    
  2. Créez un profil IPython

    $ ipython profile create pyspark
    
  3. Modifiez le profil d'environnement IPython startup / 00-pyspark-setup.py

    #coding:utf-8
    import os
    import sys
    
    os.environ['SPARK_HOME'] = '/usr/local/Cellar/apache-spark/1.1.1'
    spark_home = os.environ.get('SPARK_HOME', None)
    if not spark_home:
        raise ValueError('SPARK_HOME environment variable is not set')
    sys.path.insert(0, os.path.join(spark_home, 'libexec/python'))
    sys.path.insert(0, os.path.join(spark_home, 'libexec/python/lib/py4j-0.8.2.1-src.zip'))
    execfile(os.path.join(spark_home, 'libexec/python/pyspark/shell.py'))
    

Dans mon environnement, le fichier de configuration est dans ~ / .ipython / profile_pyspark. Réécrivons py4j-0.8.2.1-src.zip car cela dépend de la version. Sous Windows, je pense que c'était autour du dossier utilisateur.

  1. Essayez de commencer

    $ ipython notebook --profile=pyspark
    
  2. On a l'impression que quelque chose bouge. Non!

Cree.png

référence

http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/

Recommended Posts

Exécutez Apache-Spark sur le notebook IPython
Calcul parallèle avec le notebook iPython
Jouer avec Jupyter Notebook (IPython Notebook)
Exécutez IPython Notebook sur Docker
Dessin graphique avec IPython Notebook
Utilisation de Bokeh avec IPython Notebook
La vie de recherche et développement avec le notebook iPython
Créer un environnement de notebook IPython avec boot2docker
Utilisation d'Apache Spark avec le notebook Jupyter (notebook IPython)
Présentation HTML "EN DIRECT" avec IPython 3.0.0-dev, IPython Notebook
installation du notebook ipython
Recommandations du notebook IPython
Sortie de cellule riche avec Jupyter Notebook (IPython)
Comment déboguer avec Jupyter ou iPython Notebook
Dessin graphique avec jupyter (notebook ipython) + matplotlib + vagrant
Créer une table avec le notebook IPython
Exécutez Python avec VBA
Exécutez prepDE.py avec python3
Exécutez Blender avec python
Démarrez IPython avec virtualenv
Créer des diapositives avec iPython
Connecter à distance un notebook IPython
Exécutez iperf avec python
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
Approvisionnement EC2 avec Vagrant + Jupyter (IPython Notebook) sur Docker
[Apprentissage automatique] Démarrez Spark avec iPython Notebook et essayez MLlib
Je souhaite utiliser facilement les fonctions R avec le notebook ipython
[IPython] Comment partager un bloc-notes IPython
Lors de l'utilisation d'optparse avec iPython
Exécutez python avec PyCharm (Windows)
Utilisation de Graphviz avec Jupyter Notebook
Touch Flask + courir avec Heroku
Exécutez Python avec CloudFlash (arm926ej-s)
Utiliser pip avec Jupyter Notebook
Affichage des chaînes sur le notebook IPython
Utiliser Cython avec Jupyter Notebook
Pour exécuter gym_torcs avec ubutnu16
Exécuter Label avec tkinter [Python]
Lancez le serveur de notebook IPython
Exécutez Jupyter Notebook sous Windows
recharger dans le shell django avec ipython
Autoriser les connexions externes avec le notebook Jupyter
Formatage avec autopep8 sur le notebook Jupyter
Visualisez l'arbre de décision avec le notebook Jupyter
Faites un son avec le notebook Jupyter
Exécution du script au démarrage avec ipython
Exécutez Rotrics DexArm avec l'API Python
Exécutez l'application avec Flask + Heroku
Exécutez mruby avec Python ou Blender
Exécutez SwitchBot avec Bleak sur Windows 10
Exécutez le script avec la commande admin de Django
Exécutez Aprili depuis Python sur Orange
Exécutez python3 Django1.9 avec mod_wsgi (déployer)
Utilisation du japonais avec IPython @ Windows de Rodeo
Ajouter plus de noyaux avec Jupyter Notebook
Analyse pratique avec Pandas + notebook Jupyter
Notes de traitement par lots dans IPython Notebook
Jusqu'à ce que Python fonctionne sur Apache