[PYTHON] Visualisons le volume des transactions des actions TSE - Exemple Jpxlab

Dans cet article, nous allons visualiser le volume de négociation des actions TSE à l'aide de l'outil de traitement / analyse "jpxlab" des données haute fréquence des actions TSE (FLEX Historical). Je vais essayer. Voir ici pour des exemples de blocs-notes.

Préparation des métadonnées

FLEX Historical contient également des informations qui identifient l'action, mais cet exemple utilise un fichier publié par la Bourse de Tokyo qui fournit des métadonnées plus détaillées.

Ce fichier contient diverses informations sur la marque et le code de la marque Il est utile pour cartographier les noms de sociétés et pour classer les actions en catégories par secteur, TOPIX, etc.

Visualisez le volume des transactions par secteur

Pour utiliser les données historiques en combinaison avec les métadonnées fournies par ce fichier, exemple jpxlab demo -sector volume.ipynb % 20-% 20sector% 20volume.ipynb) serait un bon point de départ.

image.png

Ce cahier exploite les informations sectorielles pour montrer comment les actions sont regroupées. La figure ci-dessous montre le volume de transactions intégré pour chaque secteur en septembre 2019.

image.png

Bien qu'il s'agisse d'une simple visualisation, il peut être confirmé en un coup d'œil que le nombre de sociétés de négoce et de grossistes dans 17 catégories d'industries a augmenté le 5 septembre 2019 et que le nombre de banques dans 17 catégories d'industries a augmenté le 10 septembre 2019. Je vais. Il est également possible de filtrer uniquement les 100 premiers volumes de trading en septembre avec des changements mineurs, comme illustré dans le cahier.

Prédire le chiffre d'affaires quotidien

L'un des sujets les plus intéressants de l'analyse des données de marché est probablement la «prédiction». Diverses approches telles que l'analyse statistique et l'apprentissage automatique peuvent être envisagées, mais il est un peu difficile de construire un modèle complexe de prix des actions avec seulement un mois de données. Par conséquent, cette fois, je ne présenterai que la méthodologie et commencerai par une simple analyse des données.

Commençons par tracer l'autocorrélation du volume de trading quotidien de Toyota (7203). image.png La zone bleu clair est l'intervalle de confiance, et on peut dire qu'il y a une autocorrélation significative si la valeur qui la pénètre apparaît. L'autocorrélation est une corrélation avec sa propre copie retardée, donc si un coefficient de corrélation élevé est observé ici, on peut dire qu'il est périodique. Malheureusement, aucune corrélation significative n'a été observée dans l'exemple ci-dessus.

Ensuite, sélectionnons un stock avec une autocorrélation élevée et voyons à quoi ressemble l'intrigue. Dans l'exemple, Subaru (7270) a été sélectionné parmi les 100 meilleures actions.

image.png

Comme le montre le graphique, leg1 montre une corrélation positive relativement élevée. L'utilité réelle est ignorée car cet exemple est un échantillon très limité, mais dans les cas où plus d'échantillons sont disponibles, ces données sont quelque peu prédites par un modèle d'auto-retour tel que le modèle ARIMA. C'est possible dans de nombreux cas. Au cas où, la transition du volume de transaction d'origine est tracée comme suit.

image.png

Clustering

Faisons une autre analyse approfondie. En regroupant en fonction du modèle des variations du volume des transactions, nous relèverons le défi d'observer les actions liées et les changements de leurs tendances. Cependant, comme les échantillons utilisables pour l'apprentissage sont à chaque fois très limités, j'espère que vous les utiliserez pour de futures expériences en introduisant la méthodologie. Le cahier est jpxlab demo -cluster analysis.ipynb.

Compression dimensionnelle par T-SNE

La cible du clustering est un vecteur. Cette fois, nous voulons analyser la similitude du modèle de transition de volume de transaction pour chaque problème, il est donc nécessaire de vectoriser les données chronologiques de la transition de volume de transaction d'une manière ou d'une autre.

Cependant, ce processus est la clé, et plus le vecteur a de dimensions, plus il est difficile d'entrer dans la malédiction de la dimension et d'en extraire les caractéristiques essentielles, j'ai donc décidé d'utiliser la technique de compression de dimension pour la réduire à la dimension la plus basse possible. Devenir.

Les méthodes de compression dimensionnelle les plus connues sont PCA et MDS, mais ici nous utilisons un algorithme qui est également efficace pour les objets avec une relation non linéaire appelée T-SNE. L'entrée est un instantané des tendances brutes du chiffre d'affaires pour chaque numéro extrait dans la fenêtre glissante. Ceci est compressé en deux dimensions pour la visualisation.

image.png

Pour plus de détails, veuillez consulter Notebook, mais cela semble être significatif pendant cette période. Bien qu'il soit difficile de saisir visuellement de tels clusters, vous pouvez voir qu'il s'agit d'un outil très puissant qui peut tout faire, du clustering à la visualisation des changements de séries chronologiques avec une animation avec un code simple. Je crois que non.

De cette façon, nous espérons que vous pourrez avoir un aperçu de la possibilité que jpxlab puisse être utilisé comme une entrée pour diverses applications telles que la conception et la vérification de modèles prédictifs.

Recommended Posts

Visualisons le volume des transactions des actions TSE - Exemple Jpxlab
Visualisons GraphConvModel de DeepChem
Visualisons le nombre de personnes infectées par le virus corona avec matplotlib
Visualisez la trajectoire de Hayabusa 2
[Word2vec] Visualisons le résultat du traitement en langage naturel des avis des entreprises
Visualisez l'état de la réponse du recensement national 2020
Décidons le gagnant du bingo
J'ai vérifié le contenu du volume du docker
Visualisez la valeur limite du perceptron multicouche
Visualisez les effets de l'apprentissage profond / de la régularisation
Examinons le mécanisme de la chinchirorine de Kaiji
Visualisez les données d'exportation du journal Piyo