[PYTHON] Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)

Dies ist die letzte Episode der Datenvisualisierungsgeschichte, die bis [vorher] fortgesetzt wurde (http://qiita.com/ynakayama/items/e37c222771db53a0e629).

Streudiagramm

Wir werden die Daten aus pydata-book wie bisher verwenden.

pydata-book/ch08/macrodata.csv https://github.com/pydata/pydata-book/blob/master/ch08/macrodata.csv

import numpy as np
from pandas import *
import matplotlib.pyplot as plt

#CSV-Daten lesen
macro = read_csv('macrodata.csv')

#Nimm einige Reihen auf
data = macro[['cpi', 'm1', 'tbilrate', 'unemp']]

# .diff()Die Methode ändert den Wert in die Differenz zur vorherigen Zeile
#Weil es mit NaN beginnt.dropna()Mit Methode entfernen
trans_data = np.log(data).diff().dropna()

# trans_Daten sind ein Datensatz, der Änderungen gegenüber der vorherigen Zeile zeigt
#Letzte 5 Zeilen anzeigen
print( trans_data[-5:] )
# =>
#           cpi        m1  tbilrate     unemp
# 198 -0.007904  0.045361 -0.396881  0.105361
# 199 -0.021979  0.066753 -2.277267  0.139762
# 200  0.002340  0.010286  0.606136  0.160343
# 201  0.008419  0.037461 -0.200671  0.127339
# 202  0.008894  0.012202 -0.405465  0.042560

#Zeichnen Sie ein Streudiagramm aus zwei Zeilen
plt.scatter(trans_data['m1'], trans_data['unemp'])

plt.show()
plt.savefig("image.png ")

Streudiagramm-Matrix

Das Streudiagramm aller Paare einer Reihe von Variablen ist die Streudiagrammmatrix (http://www.okada.jp.org/RWiki/?%A5%B0%A5%E9%A5%D5%A5%) A3% A5% C3% A5% AF% A5% B9% BB% B2% B9% CD% BC% C2% CE% E3% BD% B8% A1% A7% BB% B6% C9% DB% BF% DE% B9% D4% CE% F3). Sie können dies mit der Funktion dispers_matrix erstellen.

#Streudiagrammmatrix erzeugen
from pandas.tools.plotting import scatter_matrix
scatter_matrix(trans_data, diagonal='kde', color='k', alpha=0.3)

plt.show()
plt.savefig("image2.png ")

Es dient als einfache und leistungsstarke Methode, um die Korrelation zweier beliebiger eindimensionaler Daten zu untersuchen.

Referenz

Einführung in die Datenanalyse mit Python-Datenverarbeitung mit NumPy und Pandas http://www.oreilly.co.jp/books/9784873116556/

Recommended Posts

Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)

Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (3)

Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (4)

Datenvisualisierungsmethode mit Matplotlib (1)

Datenvisualisierungsmethode mit Matplotlib (2)

Datenvisualisierung mit Pandas

Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib

Python-Anwendung: Datenvisualisierung # 2: matplotlib

Datenanalyse mit Python-Pandas

Vielseitige Datenerfassung mit Pandas + Matplotlib

Zeichnen Sie Zeitreihendaten in Python mit Pandas und Matplotlib

Fall mit Pandas-Plot, Fall mit (reinem) Matplotlib-Plot

Implementieren Sie "Data Visualization Design # 2" mit matplotlib

Pandas Daten lesen

Visualisierung von Breiten- / Längenkoordinatendaten (unter der Annahme meteorologischer Daten) unter Verwendung von Cartopy und Matplotlib

Versuchen Sie es mit PHATE, einer Methode zur Reduzierung und Visualisierung biologischer Daten

Versuchen Sie es mit matplotlib

Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib

[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt

100 Sprachverarbeitung Knock-20 (unter Verwendung von Pandas): Lesen von JSON-Daten

100-Sprach-Verarbeitung Knock-98 (unter Verwendung von Pandas): Clustering nach Ward-Methode

100 Sprachverarbeitung Knock-99 (mit Pandas): Visualisierung durch t-SNE

Datenanalyse mit xarray

Analyse von Finanzdaten durch Pandas und deren Visualisierung (2)

Holen Sie sich Amazon RDS (PostgreSQL) -Daten mithilfe von SQL mit Pandas

Python-Datenvisualisierungsbibliotheken

Analyse von Finanzdaten durch Pandas und deren Visualisierung (1)

Kreuztabelle mit Pandas

Wie man Pferderenndaten mit pandas read_html kratzt

Diagrammzeichnung mit matplotlib

[Neueste Methode] Visualisierung von Zeitreihendaten und Extraktion häufiger Muster mithilfe des Pan-Matrix-Profils

Datenbereinigung 2 Datenbereinigung mit DataFrame

Ich habe versucht, Matplotlib zu verwenden

Datenbereinigung mit Python

Ich habe versucht, EKG-Daten mit der K-Shape-Methode zu gruppieren

[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)

Datenmanipulation mit Pandas!

Aggregieren Sie Ereignisdaten mithilfe von Pandas in einem einzeiligen Ein-Benutzer-Format

Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)

Daten mit Pandas mischen

Visualisierung von Daten anhand einer erklärenden Variablen und einer objektiven Variablen

[Memo] Textabgleich im Pandas-Datenrahmen mit Flashtext

Methodenaufruf mit __getattr__

[Numpy / Pandas / Matplotlib Übung 01]

Erstellen Sie sofort ein Diagramm mit 2D-Daten mit der matplotlib von Python

Hinzufügen neuer Daten (gerade Linien und Diagramme) mit matplotlib

Leicht verständliche [Pandas] -Praxis / Datenbestätigungsmethode für Abiturienten

Analysieren Sie die Aktienkurse mithilfe der Pandas-Datenaggregation und der Gruppenoperationen

[Python] Zufällige Datenextraktion / -kombination aus DataFrame mit Random und Pandas

pandas Matplotlib Zusammenfassung nach Verwendung

Zeichnen Sie mit Pandas mehrere Diagramme

Versuchen Sie es mit matplotlib mit PyCharm

Wählen Sie Features mit Textdaten aus

Klassifizieren Sie Daten nach der k-means-Methode

Diagrammzeichnungsmethode mit matplotlib

Visualisierung von Daten nach Präfektur

Zeichnen Sie Excel-Daten mit matplotlib (2)

Lineare Regressionsmethode mit Numpy

Visualisierungsnotiz von Pandas, Seaborn

Verhalten der Pandas Rolling () Methode