[PYTHON] [Analyse des données] Analysons les actions automobiles américaines

Bonjour. Il s'agit de Hayashi @ Ienter.

Dans le précédent Blog, la bibliothèque d'analyse de données Python "scikit-learn" Introduction de l'analyse de régression dans.

À ce moment-là, j'ai installé un package Python appelé Anaconda. Cette fois, nous avons introduit Pandas et Seaborn pour la visualisation de données aux États-Unis. Analysons le parc automobile.

Lecture des données de cours de bourse

Tout d'abord, importez la bibliothèque de base pour l'analyse avec le notebook jupyter. shot1.png

Gérer le temps, lire le module datetime et les données de l'extérieur Préparez le DataReader pour utilisation. shot2.png

Par exemple, écrivons un processus pour lire les données de l'année écoulée de "[General Motors](https://ja.wikipedia.org/wiki/General Motors)" sur le site Yahoo. À propos, le code de marque de General Motors est "GM". shot3.png

Maintenant, affichons les 5 premières données. shot4_.png

La signification de chaque colonne est la suivante.

--Ouvert: prix ouvert --Haut: prix élevé

Visualisation de l'évolution des données de cours de bourse

Vérifions la transition du cours de clôture sur le graphique. Pour le cours de clôture, utilisez le cours de clôture ajusté de "Adj Close". shot5_.png

Les fluctuations quotidiennes sont un indicateur clé du risque d'investissement en actions. Par exemple, la transition de fluctuation peut être calculée à l'aide de la fonction pct_change de Series. shot6.png

Comparaison de la corrélation des cours des actions entre entreprises

Auparavant, je me suis concentré sur le cours de l'action de General Motors. Examinons ensuite la corrélation des cours des actions entre les entreprises du même secteur.

Introduisez "Seaborn" pour visualiser la corrélation. Il peut être installé en entrant la commande suivante sur la ligne de commande. pip install seaborn

Importez le module. shot7.png

Cette fois, nous examinerons la corrélation des cinq entreprises suivantes en tant que constructeurs automobiles.

--General Motors (code de marque "GM") --Ford Motor (code de marque "F") --Toyota (code de marque "TM") --Honda (code de marque "HMC") --Tesla Motors (code de marque "TSLA")

Obtenez les données des cours de clôture des 5 sociétés ci-dessus. shot8.png

Avec les données de cours de clôture de ces sociétés, nous calculerons les données de fluctuation quotidiennes. shot9_.png

J'essaierai de le tracer. shot10.png

Je ne comprends pas vraiment la relation. .. ..

Maintenant, visualisons-le en utilisant la fonction pairplot de Seaborn. shot11.png

En ce qui concerne la hauteur de la corrélation dans le graphique, plus les points de la droite sont denses, plus la corrélation est élevée. J'espère que vous pouvez l'imaginer. (Référence: [Coefficient de corrélation](https://ja.wikipedia.org/wiki/Coefficient de corrélation))

De ce point de vue Paire de sociétés américaines "GM (General Motors)" et "F (Ford Motors)", Une paire de sociétés japonaises de "TM (Toyota)" et "HMC (Honda)" Je pense que vous pouvez imaginer que la corrélation est relativement élevée.

Au contraire, les entreprises de véhicules électriques retardataires telles que "TSLA (Tesla Motors)" Je pense que vous pouvez imaginer qu'il y a peu de corrélation avec les autres entreprises.

De plus, utilisons la carte thermique de Seaborn pour rendre la corrélation plus facile à comprendre. shot12.png La valeur du coefficient de corrélation des données entre chaque entreprise est exprimée par la profondeur de couleur. La forme est plus facile à comprendre visuellement.

C'est tout pour cette histoire!

Recommended Posts

[Analyse des données] Analysons les actions automobiles américaines
Analysons les données de l'enquête par questionnaire [4e: Analyse des émotions]
Analyse de données python
Analyse des données Titanic 1
Analysons les données Covid-19 (Corona) en utilisant Python [Pour les débutants]
Regardons le diagramme de dispersion avant l'analyse des données
Analyse de données avec python 2
Analyse des données à l'aide de xarray
Analyse de données avec Python
Faisons l'analyse des données de naufrage du Titanic comme ça
Essayons l'analyse! ~ Data Scientist a également commencé à coder ~ Par Fringe81
J'ai essayé d'analyser les données scRNA-seq en utilisant l'analyse des données topologiques (TDA)