Dies ist die letzte Episode der Datenvisualisierungsgeschichte, die bis [vorher] fortgesetzt wurde (http://qiita.com/ynakayama/items/e37c222771db53a0e629).
Wir werden die Daten aus pydata-book wie bisher verwenden.
pydata-book/ch08/macrodata.csv https://github.com/pydata/pydata-book/blob/master/ch08/macrodata.csv
import numpy as np
from pandas import *
import matplotlib.pyplot as plt
#CSV-Daten lesen
macro = read_csv('macrodata.csv')
#Nimm einige Reihen auf
data = macro[['cpi', 'm1', 'tbilrate', 'unemp']]
# .diff()Die Methode ändert den Wert in die Differenz zur vorherigen Zeile
#Weil es mit NaN beginnt.dropna()Mit Methode entfernen
trans_data = np.log(data).diff().dropna()
# trans_Daten sind ein Datensatz, der Änderungen gegenüber der vorherigen Zeile zeigt
#Letzte 5 Zeilen anzeigen
print( trans_data[-5:] )
# =>
# cpi m1 tbilrate unemp
# 198 -0.007904 0.045361 -0.396881 0.105361
# 199 -0.021979 0.066753 -2.277267 0.139762
# 200 0.002340 0.010286 0.606136 0.160343
# 201 0.008419 0.037461 -0.200671 0.127339
# 202 0.008894 0.012202 -0.405465 0.042560
#Zeichnen Sie ein Streudiagramm aus zwei Zeilen
plt.scatter(trans_data['m1'], trans_data['unemp'])
plt.show()
plt.savefig("image.png ")
Das Streudiagramm aller Paare einer Reihe von Variablen ist die Streudiagrammmatrix (http://www.okada.jp.org/RWiki/?%A5%B0%A5%E9%A5%D5%A5%) A3% A5% C3% A5% AF% A5% B9% BB% B2% B9% CD% BC% C2% CE% E3% BD% B8% A1% A7% BB% B6% C9% DB% BF% DE% B9% D4% CE% F3). Sie können dies mit der Funktion dispers_matrix erstellen.
#Streudiagrammmatrix erzeugen
from pandas.tools.plotting import scatter_matrix
scatter_matrix(trans_data, diagonal='kde', color='k', alpha=0.3)
plt.show()
plt.savefig("image2.png ")
Es dient als einfache und leistungsstarke Methode, um die Korrelation zweier beliebiger eindimensionaler Daten zu untersuchen.
Einführung in die Datenanalyse mit Python-Datenverarbeitung mit NumPy und Pandas http://www.oreilly.co.jp/books/9784873116556/
Recommended Posts