Hallo. Dies ist Hayashi @ Ienter.
Im vorherigen Blog wurde die Python-Datenanalysebibliothek "scikit-learn" Einführung der Regressionsanalyse in.
Zu dieser Zeit habe ich ein Python-Paket namens [Anaconda] installiert (https://www.continuum.io/downloads). Dieses Mal haben wir Pandas und Seaborn für die Datenvisualisierung in den USA eingeführt. Lassen Sie uns den Automobilbestand analysieren.
Importieren Sie zunächst die Basisbibliothek zur Analyse mit dem Jupiter-Notizbuch.
Zur Handhabung der Zeit, zum Datum / Uhrzeit-Modul und zum Lesen von Daten von außen Bereiten Sie den DataReader für die Verwendung vor.
Schreiben wir beispielsweise einen Prozess zum Lesen der Daten für das vergangene Jahr von "[General Motors](https://ja.wikipedia.org/wiki/General Motors)" von der Yahoo-Website. Der Markencode von General Motors lautet übrigens "GM".
Lassen Sie uns nun die Top 5 Daten anzeigen.
Die Bedeutung jeder Spalte ist wie folgt.
--Öffnen: Offener Preis
Lassen Sie uns den Übergang des Schlusskurses in der Grafik überprüfen. Verwenden Sie für den Schlusskurs den angepassten Schlusskurs von "Adj Close".
Tägliche Schwankungen sind ein Schlüsselindikator für das Aktieninvestitionsrisiko. Beispielsweise kann der Fluktuationsübergang mithilfe der Funktion pct_change von Series berechnet werden.
Zuvor habe ich mich auf den Aktienkurs von General Motors konzentriert. Als nächstes betrachten wir die Korrelation der Aktienkurse zwischen Unternehmen derselben Branche.
Führen Sie "Seaborn" ein, um die Korrelation zu visualisieren.
Sie kann installiert werden, indem Sie den folgenden Befehl in die Befehlszeile eingeben.
pip install seaborn
Importieren Sie das Modul.
Dieses Mal werden wir die Korrelation der folgenden fünf Unternehmen als Automobilhersteller untersuchen.
--Allgemeine Motoren (Markencode "GM")
Holen Sie sich die Schlusskursdaten der oben genannten 5 Unternehmen.
Mit den Schlusskursdaten dieser Unternehmen berechnen wir die täglichen Schwankungsdaten.
Ich werde versuchen, es zu planen.
Ich verstehe die Beziehung nicht wirklich. .. ..
Jetzt visualisieren wir es mit der Pairplot-Funktion von Seaborn.
In Bezug auf die Höhe der Korrelation im Diagramm ist die Korrelation umso höher, je dichter die Punkte auf der Geraden sind. Ich hoffe du kannst es dir vorstellen. (Referenz: Korrelationskoeffizient)
Aus dieser Sicht US-Firmenpaar "GM (General Motors)" und "F (Ford Motors)", Ein Paar japanischer Firmen von "TM (Toyota)" und "HMC (Honda)" Ich denke, Sie können sich vorstellen, dass die Korrelation relativ hoch ist.
Im Gegenteil, Nachzügler von Elektrofahrzeugen wie "TSLA (Tesla Motors)" Ich denke, Sie können sich vorstellen, dass es kaum Korrelationen mit anderen Unternehmen gibt.
Verwenden wir außerdem die Heatmap von Seaborn, um das Verständnis der Korrelation zu erleichtern. Der Korrelationskoeffizientenwert der Daten zwischen den einzelnen Unternehmen wird durch die Farbtiefe ausgedrückt. Die Form ist optisch leichter zu verstehen.
Das ist alles für diese Geschichte!
Recommended Posts