[PYTHON] Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)

Dies ist die letzte Episode der Datenvisualisierungsgeschichte, die bis [vorher] fortgesetzt wurde (http://qiita.com/ynakayama/items/e37c222771db53a0e629).

Streudiagramm

Wir werden die Daten aus pydata-book wie bisher verwenden.

pydata-book/ch08/macrodata.csv https://github.com/pydata/pydata-book/blob/master/ch08/macrodata.csv

import numpy as np
from pandas import *
import matplotlib.pyplot as plt

#CSV-Daten lesen
macro = read_csv('macrodata.csv')

#Nimm einige Reihen auf
data = macro[['cpi', 'm1', 'tbilrate', 'unemp']]

# .diff()Die Methode ändert den Wert in die Differenz zur vorherigen Zeile
#Weil es mit NaN beginnt.dropna()Mit Methode entfernen
trans_data = np.log(data).diff().dropna()

# trans_Daten sind ein Datensatz, der Änderungen gegenüber der vorherigen Zeile zeigt
#Letzte 5 Zeilen anzeigen
print( trans_data[-5:] )
# =>
#           cpi        m1  tbilrate     unemp
# 198 -0.007904  0.045361 -0.396881  0.105361
# 199 -0.021979  0.066753 -2.277267  0.139762
# 200  0.002340  0.010286  0.606136  0.160343
# 201  0.008419  0.037461 -0.200671  0.127339
# 202  0.008894  0.012202 -0.405465  0.042560

#Zeichnen Sie ein Streudiagramm aus zwei Zeilen
plt.scatter(trans_data['m1'], trans_data['unemp'])

plt.show()
plt.savefig("image.png ")

image.png

Streudiagramm-Matrix

Das Streudiagramm aller Paare einer Reihe von Variablen ist die Streudiagrammmatrix (http://www.okada.jp.org/RWiki/?%A5%B0%A5%E9%A5%D5%A5%) A3% A5% C3% A5% AF% A5% B9% BB% B2% B9% CD% BC% C2% CE% E3% BD% B8% A1% A7% BB% B6% C9% DB% BF% DE% B9% D4% CE% F3). Sie können dies mit der Funktion dispers_matrix erstellen.

#Streudiagrammmatrix erzeugen
from pandas.tools.plotting import scatter_matrix
scatter_matrix(trans_data, diagonal='kde', color='k', alpha=0.3)

plt.show()
plt.savefig("image2.png ")

image2.png

Es dient als einfache und leistungsstarke Methode, um die Korrelation zweier beliebiger eindimensionaler Daten zu untersuchen.

Referenz

Einführung in die Datenanalyse mit Python-Datenverarbeitung mit NumPy und Pandas http://www.oreilly.co.jp/books/9784873116556/

Recommended Posts

Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (5)
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (3)
Datenvisualisierungsmethode mit Matplotlib (+ Pandas) (4)
Datenvisualisierungsmethode mit Matplotlib (1)
Datenvisualisierungsmethode mit Matplotlib (2)
Datenvisualisierung mit Pandas
Implementieren Sie "Data Visualization Design # 3" mit Pandas und Matplotlib
Python-Anwendung: Datenvisualisierung # 2: matplotlib
Datenanalyse mit Python-Pandas
Vielseitige Datenerfassung mit Pandas + Matplotlib
Zeichnen Sie Zeitreihendaten in Python mit Pandas und Matplotlib
Fall mit Pandas-Plot, Fall mit (reinem) Matplotlib-Plot
Implementieren Sie "Data Visualization Design # 2" mit matplotlib
Pandas Daten lesen
Visualisierung von Breiten- / Längenkoordinatendaten (unter der Annahme meteorologischer Daten) unter Verwendung von Cartopy und Matplotlib
Versuchen Sie es mit PHATE, einer Methode zur Reduzierung und Visualisierung biologischer Daten
Versuchen Sie es mit matplotlib
Lesen Sie Python-CSV-Daten mit Pandas ⇒ Graph mit Matplotlib
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
100 Sprachverarbeitung Knock-20 (unter Verwendung von Pandas): Lesen von JSON-Daten
100-Sprach-Verarbeitung Knock-98 (unter Verwendung von Pandas): Clustering nach Ward-Methode
100 Sprachverarbeitung Knock-99 (mit Pandas): Visualisierung durch t-SNE
Datenanalyse mit xarray
Analyse von Finanzdaten durch Pandas und deren Visualisierung (2)
Holen Sie sich Amazon RDS (PostgreSQL) -Daten mithilfe von SQL mit Pandas
Python-Datenvisualisierungsbibliotheken
Analyse von Finanzdaten durch Pandas und deren Visualisierung (1)
Kreuztabelle mit Pandas
Wie man Pferderenndaten mit pandas read_html kratzt
Diagrammzeichnung mit matplotlib
[Neueste Methode] Visualisierung von Zeitreihendaten und Extraktion häufiger Muster mithilfe des Pan-Matrix-Profils
Datenbereinigung 2 Datenbereinigung mit DataFrame
Ich habe versucht, Matplotlib zu verwenden
Datenbereinigung mit Python
Ich habe versucht, EKG-Daten mit der K-Shape-Methode zu gruppieren
[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)
Datenmanipulation mit Pandas!
Aggregieren Sie Ereignisdaten mithilfe von Pandas in einem einzeiligen Ein-Benutzer-Format
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
Daten mit Pandas mischen
Visualisierung von Daten anhand einer erklärenden Variablen und einer objektiven Variablen
[Memo] Textabgleich im Pandas-Datenrahmen mit Flashtext
Methodenaufruf mit __getattr__
[Numpy / Pandas / Matplotlib Übung 01]
Erstellen Sie sofort ein Diagramm mit 2D-Daten mit der matplotlib von Python
Hinzufügen neuer Daten (gerade Linien und Diagramme) mit matplotlib
Leicht verständliche [Pandas] -Praxis / Datenbestätigungsmethode für Abiturienten
Analysieren Sie die Aktienkurse mithilfe der Pandas-Datenaggregation und der Gruppenoperationen
[Python] Zufällige Datenextraktion / -kombination aus DataFrame mit Random und Pandas
pandas Matplotlib Zusammenfassung nach Verwendung
Zeichnen Sie mit Pandas mehrere Diagramme
Versuchen Sie es mit matplotlib mit PyCharm
Wählen Sie Features mit Textdaten aus
Klassifizieren Sie Daten nach der k-means-Methode
Diagrammzeichnungsmethode mit matplotlib
Visualisierung von Daten nach Präfektur
Zeichnen Sie Excel-Daten mit matplotlib (2)
Lineare Regressionsmethode mit Numpy
Visualisierungsnotiz von Pandas, Seaborn
Verhalten der Pandas Rolling () Methode