[PYTHON] Prévision du cours de l'action par machine learning Numerai Signals

introduction

L'article précédent était ici. Cet article est destiné à ceux qui ont participé au Tournoi Numerai, et sera expliqué en supposant qu'ils ont des connaissances préalables.

Le Tournoi Numerai expliqué dans l'article précédent a concouru pour la performance prédictive avec un jeu de données préparé à l'avance par la direction. Numerai Signals, en revanche, est un champ de bataille plus pratique et plus vaste. Les utilisateurs doivent préparer leur propre ensemble de données pour la prédiction. Au contraire, même le choix de l'univers est entre leurs propres mains. Il est toujours en version bêta, mais nous pensons que les participants pourront profiter des mêmes avantages considérables que Tournament à l'avenir. Ci-dessous, nous expliquerons les spécifications des signaux, les incitations à participer et les points à garder à l'esprit lors de la construction des signaux.

Spécifications des signaux numériques

Vue d'ensemble des signaux

La documentation Signals est ici [https://docs.numer.ai/numerai-signals/signals-overview). Signals fournit des prévisions de hausse et de baisse des cours des actions sur les marchés du monde entier. Comme le montre l'exemple ci-dessous, soumettez la prévision des hauts et des bas sous forme de valeur numérique comprise entre 0 et 1 (probabilité en apprentissage automatique général). L'objectif ultime des participants est d'avoir un fonds spéculatif basé sur les données comme Numerai «acheter» le signal soumis. Il accède à diverses sources de données à travers le monde, trouve des fonctionnalités avec beaucoup d'alpha et en extrait des signaux avec des performances de prédiction élevées et de l'originalité. Et il se remplace comme faisant partie du cerveau des hedge funds. Quelle tentative passionnante. Expliquons les spécifications des signaux ci-dessous. 01.png

Actif cible

Numerai Signals cible les actions sur les marchés du monde entier, avec un total d'environ 5 200 à l'heure actuelle. La liste change tous les jours, mais la plupart des stocks sont différés, seuls les stocks déficitaires étant remplacés. La dernière liste est disponible ici [https://numerai-quant-public-data.s3-us-west-2.amazonaws.com/example_predictions/latest.csv).

Pour référence, nous avons tabulé le nombre d'actions sur quel marché. Le plus important est le marché américain, avec plus de 2000 actions. Viennent ensuite le marché japonais, le marché coréen et le marché de Londres. 02.png

Les participants n'ont pas à soumettre de prévisions pour tous ces stocks. Vous pouvez créer votre propre univers à partir de plus de 5 000 actions (mais vous avez besoin d'au moins 100 actions). Bien que cela ait un degré élevé de liberté, cela nécessite également un jugement important sur la façon de sélectionner un univers.

À propos de l'acquisition de données

Pour ces stocks, les participants eux-mêmes doivent collecter les données nécessaires à la prévision. Numerai Signals est une plate-forme pour les utilisateurs qui ont déjà construit leur propre système de prévision et qui ont accès aux données du marché. La source de données officiellement utilisée par l'opération pour évaluer les performances prédictives des participants est Quandl. D'autres sources de données incluent Quantopian et Alpaca. Le Forum de Numerai partage une liste de sources de données bon marché, donc ) Doit être mentionné. J'utilise actuellement Yahoo Finance.

À propos de la soumission

Les participants peuvent soumettre le résultat de la prédiction à tout moment. Les prédictions des participants conserveront le contenu de la soumission finale jusqu'à la prochaine soumission. En d'autres termes, les participants peuvent rééquilibrer leur portefeuille en soumettant les résultats des prévisions. S'il s'agit d'un modèle de prédiction hebdomadaire, il peut être soumis une fois par semaine. Le délai dans l'évaluation du classement, qui sera décrit plus loin, est quotidien et est basé sur le cours de clôture (proche de la prévision de clôture).

Une chose à garder à l'esprit est que les résultats des prédictions seront reflétés à l'heure de clôture à côté de la soumission finale. En d'autres termes, pour prédire le lendemain, il est nécessaire de se soumettre avant la fermeture du marché. Les résultats de la prédiction sont évalués quotidiennement. Une fois soumis, les résultats prévisionnels sont valides jusqu'à 60 jours plus tard, de sorte que la prochaine soumission (rééquilibrage) doit être effectuée dans les 60 jours. 03.png

Classement

Formel, mais il y a un classement. La norme de classement est actuellement le ratio élevé des rendements quotidiens. 05.png

Le rapport net est calculé comme suit. Ici, $ r_ {long} $ est le rendement quotidien des actions incluses dans la moitié supérieure des résultats de prédiction, et $ r_ {short} $ est le rendement quotidien des actions incluses dans la moitié inférieure (lorsque le nombre d'actions est impair). , La marque au milieu est incluse dans Long). Cette formule n'est peut-être pas très courante, mais le résultat est presque le même que $ ave (r_ {long}) - ave (r_ {short}) $. Sharpe est un ratio net converti de quotidien à annuel. Où $ r_ {daily} $ contient tous les résultats une fois que l'utilisateur a lancé la soumission. Si vous soumettez un résultat de prédiction à variance élevée à titre d'essai, il continuera à être reflété tout au long de votre vie, il peut donc être préférable de commencer la soumission une fois que le modèle a été décidé dans une certaine mesure.

r_{daily}=\frac{1+ave(r_{long})}{1+ave(r_{short})}-1\\
Sharpe=\sqrt{365} \times \frac{ave(r_{daily})}{stdev(r_{daily})}

De plus, au moins les données des 20 derniers jours doivent être répertoriées dans le classement. Cependant, comme il est actuellement en version bêta, il semble qu'il apparaîtra dans le classement immédiatement après la soumission (à proprement parler, environ 3 jours ouvrables après l'agrégation des résultats).

Système de récompense

Récompense (ou collection) pour la mise

Au moment de la rédaction de l'article (23/06), les spécifications de mise n'ont pas été décidées. Les utilisateurs doivent miser sur la RMN pour soutenir leurs prédictions (bien sûr, ils peuvent participer sans jalonnement, mais ils ne sont pas inclus dans les récompenses ou les évaluations). Il s'agit d'une spécification naturelle car certains utilisateurs soumettent des résultats de prédiction expérimentale ou visent des poinçons chanceux. L'enjeu devrait être mis en œuvre dans un proche avenir. Ce chapitre sera mis à jour dès que les spécifications de pieu seront décidées.

Achat de Singal

Numerai peut acheter des signaux séparément des récompenses de mise. Cependant, cette norme d'achat et le montant de la compensation ne seront pas divulgués. La seule chose que nous pouvons voir est que Numerai veut un signal robuste, stable à long terme et ayant une faible corrélation avec d'autres facteurs communs. Son originalité est plus importante que ses performances prédictives, et bien sûr il ne s'achète pas en fonction du classement des classements.

Incitation à participer aux signaux

Ce chapitre sera mis à jour dès que les spécifications de mise sont décidées, mais il est considéré que les incitations suivantes existent dans les signaux basés sur les résultats du tournoi. Ce sont des avantages étonnamment importants pour les traders du système. L'auteur, qui cherchait à gérer des actions américaines individuelles, prévoit également de maximiser ces avantages.

Points à garder à l'esprit lors de la création de signaux

Sélection d'univers

Nous considérons la sélection d'univers comme l'élément le plus important dans Signals. Si le pouvoir prédictif est le même, plus l'univers est large, meilleur est le rapport net. En supposant que le pouvoir prédictif est constant, le ratio net s'améliore proportionnellement à la puissance 1/2 du nombre d'actions dans l'univers. La figure ci-dessous est un résultat de simulation idéal. D'un autre côté, si trop d'actions sont prises, il est possible que des actions avec une volatilité extrêmement élevée soient incluses, ou les caractéristiques qui étaient visibles dans un petit nombre d'univers peuvent ne pas être visibles, et la performance de prévision globale peut se détériorer. Par conséquent, en limitant l'univers à un univers plus étroit, il existe une option pour améliorer le pouvoir explicatif au sein de l'univers tout en se réduisant aux actions avec des mouvements de prix stables. 06.png

Je pense que le réglage de l'hyper paramètre appelé univers est la clé pour distinguer la supériorité et l'infériorité de la performance. En outre, afin d'effectuer le réglage de manière complète, la capacité de créer une base de données précise pour autant de stocks que possible est nécessaire.

Optimisation du délai (fréquence de rééquilibrage)

Fondamentalement, plus le rééquilibrage est court, meilleur est le pouvoir prédictif et plus les résultats sont stables. En effet, le pouvoir prédictif des données financières diminue considérablement dans le temps. Vous trouverez ci-dessous un exemple des courbes de profits et pertes lors d'un rééquilibrage quotidien, hebdomadaire et mensuel. 07.png

Cependant, dans le monde réel, des coûts d'exécution sont engagés, il n'est donc souvent pas possible de rééquilibrer fréquemment. Numerai Signals n'encourt actuellement aucune pénalité pour la fréquence des soumissions. Cependant, si les prévisions changent fréquemment, ce n'est pas préférable pour un fonds avec un montant d'investissement important, il est donc possible qu'un certain montant de mise soit collecté par soumission. L'utilisateur optimisera lui-même la période de prévision en tenant compte des circonstances autour de ce point.

en conclusion

Dans cet article, j'ai expliqué les spécifications de Numerai Signals, les incitations à participer et les points à garder à l'esprit lors de la création de signaux. Numerai Signals a un degré élevé de liberté, et la plupart de la stratégie est laissée aux participants, qui peuvent contester cela en utilisant pleinement leurs propres connaissances. Et s'il y a un avenir dans lequel les hedge funds compteront sur vous à la fin, ce serait un grand honneur. Le moment est venu pour les hedge funds de s'appuyer sur des investisseurs individuels pour prendre leurs décisions d'investissement. Vous avez été excité.

Maintenant, recherchons un superbe Signal qui contient beaucoup d'alpha.

Recommended Posts

Prévision du cours de l'action par machine learning Numerai Signals
Les prévisions du cours des actions par apprentissage automatique sont si vraies Signaux Numerai
Prévisions du cours des actions par apprentissage automatique Commençons Numerai
Prévision du cours des actions à l'aide de l'apprentissage automatique (édition de retour)
Mémo d'étude Python & Machine Learning ⑦: Prévision du cours de l'action
Prévision du cours des actions à l'aide du Deep Learning (TensorFlow)
Prévision du cours des actions à l'aide du Deep Learning (TensorFlow) - Partie 2
Prévision du cours de l'action 2 Chapitre 2
Estimation raisonnable du prix de Mercari par apprentissage automatique
Prévision du cours de l'action à l'aide du Deep Learning [acquisition de données]
Prévision du cours de l'action 1 Chapitre 1
Est-il possible de manger avec les prévisions de cours de bourse par apprentissage automatique [Plan de mise en œuvre]
Prévision du cours de l'action avec tensorflow
Python: prévision du cours de l'action, partie 2
4 [/] Quatre arithmétiques par apprentissage automatique
Python: prévision du cours de l'action partie 1
Résumé de l'apprentissage automatique par les débutants de Python
[Python] Mes prévisions de cours de bourse [HFT]
Prédire les variations du cours des actions à l'aide de l'étiquetage métallique et de l'apprentissage automatique en deux étapes
Code d'acquisition de stock par grattage (Selenium)
Faire le contrôle d'un homme sandwich par l'apprentissage automatique ver4
Est-il possible de manger avec la prévision du cours des actions par apprentissage automatique [Machine learning partie 1]
[Échec] Trouvez Maki Horikita par apprentissage automatique
Apprentissage automatique
Prévision de stock avec TensorFlow (LSTM) ~ Prévision de stock Partie 1 ~
Mémo d'étude Python & Machine Learning ④: Machine Learning par rétro-propagation
Classification des images de guitare par apprentissage automatique Partie 1
Tournoi Numerai - Fusion de quants traditionnels et apprentissage automatique -
Classer les informations liées à l'apprentissage automatique par modèle de sujet
Analyse de l'utilisation de l'espace partagé par l'apprentissage automatique
[Français] scikit-learn 0.18 Introduction de l'apprentissage automatique par le didacticiel scikit-learn
Classification des images de guitare par apprentissage automatique, partie 2
Histoire de l'analyse de données par apprentissage automatique
[Memo] Apprentissage automatique
Classification de l'apprentissage automatique
Exemple d'apprentissage automatique
Prévision de stock avec TensorFlow (perceptron multicouche: MLP) ~ Prévision de stock 2 ~
Investissement en actions par apprentissage approfondi (méthode du gradient de politique) (1)
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer du chapitre 2
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer chapitres 1 et 2