[PYTHON] Analyse pratique avec Pandas + notebook Jupyter

environnement

Python 3.5.1 :: Anaconda 2.5.0

N'utilisez-vous pas pandas.DataFrame?

N'est-il pas difficile de lire csv avec python, de lire json ou d'exécuter (hogehoge) un document SQL à partir de DB? Surtout pour DB, il est très difficile de séparer la restauration et la validation dans la gestion des erreurs.

Si vous utilisez des pandas, ce problème sera résolu.

Chargement du CSV commun

before


import csv

with open("data.csv",'r') as f:
	data = csv.reader(f)
	
for row in data:
	print(row)

after


import pandas as pd

data = pd.read_csv("data.csv")
print(data)

Déposer les données sélectionnées dans SQL en python (postgres)

before


import psycopg2

conn = psycopg2.connect("dbname=test host=localhost user=postgres")
cur = conn.cursor()
cur.execute("SELECT * FROM test_table LIMIT 100;")
data = cur.fetchall()

for row in data:
	print(row)

after


import pandas as pd
import psycopg2

conn = psycopg2.connect("dbname=test host=localhost user=postgres")
data = pd.read_sql("SELECT * FROM test_table LIMIT 100;",conn)
print(data)

La bonne chose à propos des pandas est __ La structure des données au format tableau peut être conservée telle quelle __ Il y a. En d'autres termes, vous pouvez extraire la structure de la table DB ou la colonne csv telle quelle.

Exemple (exemple de fichier Csv)

__Jupyter notebook rend plus facile à voir et plus pratique __

スクリーンショット 2016-07-19 13.18.35.png

__ Vérifiez facilement le type de chaque colonne __

スクリーンショット 2016-07-19 13.22.31.png (Le type appelé objet est une chaîne de caractères car la colonne contient plusieurs types de données. Par exemple, si vous souhaitez convertir une colonne contenant des nombres et des caractères étranges en un type uniquement numérique, Si vous définissez df ["nom_colonne"]. Convert_objects (convert_numeric = True), ceux qui n'ont pas pu être convertis seront stockés sous NaN)

Il existe de nombreux articles sur la façon de pandas, et Jupyter notebook est un outil très facile à utiliser. Si vous les combinez, vous pouvez analyser les données très rapidement et facilement, alors essayez-le.

Postscript Nous résumerons les méthodes utiles d'agrégation et d'analyse des données avec les pandas sous forme de mémorandum (sera mis à jour à tout moment) Méthode minimale à retenir lors de l'agrégation de données avec Pandas

Recommended Posts

Analyse pratique avec Pandas + notebook Jupyter
Analyse des données pour améliorer POG 2 ~ Analyse avec le notebook jupyter ~
Utilisation de Graphviz avec Jupyter Notebook
Utiliser pip avec Jupyter Notebook
Jouer avec Jupyter Notebook (IPython Notebook)
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
Autoriser les connexions externes avec le notebook Jupyter
Formatage avec autopep8 sur le notebook Jupyter
Visualisez l'arbre de décision avec le notebook Jupyter
Faites un son avec le notebook Jupyter
Utiliser Markdown avec le notebook Jupyter (avec raccourci)
Créez un environnement d'expérimentation / d'analyse psychologique confortable avec PsychoPy + Jupyter Notebook
Utiliser nbextensions avec le notebook Jupyter d'Anaconda
Utilisation d'Apache Spark avec le notebook Jupyter (notebook IPython)
Je veux écrire un blog avec Jupyter Notebook
Utiliser Jupyter Lab et Jupyter Notebook avec EC2
Essayez SVM avec scikit-learn sur Jupyter Notebook
Comment utiliser le notebook Jupyter avec ABCI
Lier Python et JavaScript avec le notebook Jupyter
[Mémo Jupyter Notebook] Afficher les kanji avec matplotlib
Sortie de cellule riche avec Jupyter Notebook (IPython)
Mémo Jupyter Notebook
Présentation de Jupyter Notebook
Puissant ordinateur portable Jupyter
Paramètres de lecture de fichiers S3 avec des pandas depuis Jupyter Notebook sur AWS
Mot de passe du notebook Jupyter
Mémo Jupyter Notebook
Agrégation pratique de séries chronologiques avec TimeGrouper de pandas
Comment déboguer avec Jupyter ou iPython Notebook
Construire un environnement d'analyse avec Docker (jupyter notebook + PostgreSQL)
Vérifiez la précision du NLC avec le bloc-notes Jupyter de Watson Studio
Essayez d'utiliser l'environnement virtuel conda avec Jupyter Notebook
Visualisez de manière interactive les données avec Treasure Data, Pandas et Jupyter.
Remplissez la largeur du bloc-notes Jupyter pour remplir le navigateur
Dessin graphique avec jupyter (notebook ipython) + matplotlib + vagrant
Analyse de données avec python 2
Construction d'environnement virtuel avec Docker + Flask (Python) + notebook Jupyter
Sélection multiple avec Jupyter
Bougies avec plotly + Jupyter
Machine learning facile avec AutoAI (partie 4) Jupyter Notebook
Visualisez rapidement avec les pandas
Démarrer Jupyter Notebook
Analyse du panier avec Spark (1)
Échantillonnage bootstrap avec Pandas
Traitement des ensembles de données avec des pandas (2)
Fusionner les ensembles de données avec les pandas
installation de jupyter et pandas
Pandas apprenant avec la chimioinfomatique
Surveiller le modèle d'entraînement avec TensorBord sur Jupyter Notebook
Analyse de dépendance avec CaboCha
Analyse vocale par python
Essayez les opérations de base sur Pandas DataFrame sur Jupyter Notebook
Dessiner une structure arborescente avec D3.js dans Jupyter Notebook
Importer des cellules spécifiques à partir d'autres blocs-notes avec le bloc-notes Jupyter
Approvisionnement EC2 avec Vagrant + Jupyter (IPython Notebook) sur Docker
Visualisation des données avec les pandas
3 astuces du notebook Jupyter (Python)
Manipulation des données avec les Pandas!
Mélangez les données avec les pandas
Analyse vocale par python
Analyse dynamique par Valgrind