[PYTHON] Bequeme Analyse mit Pandas + Jupyter Notebook

Umgebung

Python 3.5.1 :: Anaconda 2.5.0

Verwenden Sie nicht pandas.DataFrame?

Ist es nicht schwierig, CSV mit Python zu lesen, JSON zu lesen oder ein SQL-Dokument aus der Datenbank auszuführen (hogehoge)? Insbesondere für DB ist es sehr mühsam, Rollback und Commit bei der Fehlerbehandlung zu trennen.

Wenn Sie Pandas verwenden, wird dieses Problem gelöst.

Laden der gemeinsamen CSV

before


import csv

with open("data.csv",'r') as f:
	data = csv.reader(f)
	
for row in data:
	print(row)

after


import pandas as pd

data = pd.read_csv("data.csv")
print(data)

Löschen Sie ausgewählte Daten in SQL in Python (postgres).

before


import psycopg2

conn = psycopg2.connect("dbname=test host=localhost user=postgres")
cur = conn.cursor()
cur.execute("SELECT * FROM test_table LIMIT 100;")
data = cur.fetchall()

for row in data:
	print(row)

after


import pandas as pd
import psycopg2

conn = psycopg2.connect("dbname=test host=localhost user=postgres")
data = pd.read_sql("SELECT * FROM test_table LIMIT 100;",conn)
print(data)

Das Gute an Pandas ist __ Die Datenstruktur im Tabellenformat kann unverändert beibehalten werden __ Es gibt. Mit anderen Worten, Sie können die DB-Tabellenstruktur oder die CSV-Spalte unverändert abrufen.

Beispiel (Beispiel für eine Csv-Datei)

__Jupyter Notebook macht es einfacher zu sehen und bequemer __

スクリーンショット 2016-07-19 13.18.35.png

__ Überprüfen Sie einfach den Typ jeder Spalte __

スクリーンショット 2016-07-19 13.22.31.png (Der als Objekt bezeichnete Typ ist eine Zeichenfolge, da die Spalte mehrere Typdaten enthält. Wenn Sie beispielsweise eine Spalte mit Zahlen und seltsamen Zeichen in einen Nur-Zahlen-Typ konvertieren möchten, Wenn Sie df ["column_name"]. Convert_objects (convert_numeric = True) setzen, werden diejenigen, die nicht konvertiert werden konnten, als NaN gespeichert.)

Es gibt viele Artikel über Pandas, und das Jupyter-Notizbuch ist ein sehr einfach zu verwendendes Werkzeug. Wenn Sie sie kombinieren, können Sie die Daten sehr schnell und einfach analysieren. Probieren Sie es also aus.

Nachtrag Wir werden nützliche Methoden für die Datenaggregation und -analyse mit Pandas als Memorandum zusammenfassen (wird jederzeit aktualisiert). Mindestmethode beim Aggregieren von Daten mit Pandas

Recommended Posts

Bequeme Analyse mit Pandas + Jupyter Notebook
Datenanalyse zur Verbesserung von POG 2 ~ Analyse mit Jupiter-Notebook ~
Verwenden von Graphviz mit Jupyter Notebook
Verwenden Sie pip mit Jupyter Notebook
Spielen Sie mit Jupyter Notebook (IPython Notebook)
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Ermöglichen Sie externe Verbindungen mit dem Jupiter-Notebook
Formatieren mit autopep8 auf Jupyter Notebook
Visualisieren Sie den Entscheidungsbaum mit einem Jupyter-Notizbuch
Machen Sie einen Sound mit Jupyter Notebook
Markdown mit Jupyter-Notebook verwenden (mit Verknüpfung)
Erstellen Sie mit PsychoPy + Jupyter Notebook eine komfortable Umgebung für psychologische Experimente / Analysen
Verwenden Sie nbextensions mit Anacondas Jupyter-Notizbuch
Verwenden von Apache Spark mit Jupyter Notebook (IPython Notebook)
Ich möchte einen Blog mit Jupyter Notebook schreiben
Verwenden Sie Jupyter Lab und Jupyter Notebook mit EC2
Probieren Sie SVM mit scikit-learn auf Jupyter Notebook aus
Verwendung des Jupyter-Notebooks mit ABCI
Verknüpfung von Python und JavaScript mit dem Jupiter-Notizbuch
[Jupyter Notebook Memo] Kanji mit Matplotlib anzeigen
Reichhaltige Zellenausgabe mit Jupyter Notebook (IPython)
Jupyter Notizbuch Memo
Einführung in Jupyter Notebook
Leistungsstarkes Jupyter-Notizbuch
Einstellungen zum Lesen von S3-Dateien mit Pandas aus Jupyter Notebook unter AWS
Jupyter Notebook Passwort
Jupyter Notizbuch Memo
Bequeme Zeitreihenaggregation mit TimeGrouper von Pandas
So debuggen Sie mit Jupyter oder iPython Notebook
Erstellen einer Analyseumgebung mit Docker (Jupyter Notebook + PostgreSQL)
Überprüfen Sie die NLC-Genauigkeit mit dem Jupyter Notebook von Watson Studio
Versuchen Sie, die virtuelle Umgebung von conda mit Jupyter Notebook zu verwenden
Visualisieren Sie Daten interaktiv mit TreasureData, Pandas und Jupyter.
Füllen Sie die Breite des Jupyter-Notizbuchs, um den Browser zu füllen
Grafikzeichnung mit Jupyter (Ipython-Notizbuch) + Matplotlib + Vagabund
Datenanalyse mit Python 2
Aufbau einer virtuellen Umgebung mit Docker + Flask (Python) + Jupyter-Notebook
Mehrfachauswahl mit Jupyter
Kerzenbeine mit Plot + Jupyter
Einfaches maschinelles Lernen mit AutoAI (Teil 4) Jupyter Notebook
Mit Pandas schnell visualisieren
Starten Sie Jupyter Notebook
Korbanalyse mit Spark (1)
Bootstrap-Sampling mit Pandas
Datensätze mit Pandas verarbeiten (2)
Zusammenführen von Datensätzen mit Pandas
Installation von Jupyter und Pandas
Pandas lernen mit Chemoinfomatik
Überwachen Sie das Trainingsmodell mit TensorBord auf Jupyter Notebook
Abhängigkeitsanalyse mit CaboCha
Sprachanalyse mit Python
Probieren Sie grundlegende Operationen mit Pandas DataFrame auf Jupyter Notebook aus
Zeichnen einer Baumstruktur mit D3.js in Jupyter Notebook
Importieren Sie bestimmte Zellen aus anderen Notizbüchern mit Jupyter-Notizbuch
EC2-Bereitstellung mit Vagrant + Jupyter (IPython Notebook) auf Docker
Datenvisualisierung mit Pandas
3 Jupyter Notebook (Python) Tricks
Datenmanipulation mit Pandas!
Daten mit Pandas mischen
Sprachanalyse mit Python
Dynamische Analyse von Valgrind