[PYTHON] J'ai lu 10 livres liés aux données de séries chronologiques, je vais donc rédiger une critique.

À propos de la position debout de chaque livre

Je m'inquiète de savoir sur quel axe expliquer la position debout, mais cette fois j'ai essayé de la positionner comme «arbitraire et préjugée» avec deux axes sur le «niveau du lecteur cible» et la «relation avec les séries chronologiques».

image.png

introduction

Au travail, j'utilise diverses méthodes pour diverses données liées à l'analyse des données, mais lorsque je les analyse, il existe étonnamment de nombreuses données chronologiques.

Les prédictions numériques et la détection d'anomalies sont souvent enregistrées avec l'heure. Afin d'acquérir des connaissances sur ces données de séries chronologiques, j'ai décidé de lire le livre de manière exhaustive et d'acquérir des connaissances. Cette fois, j'aimerais vous aider à acheter votre livre en faisant une critique de "Qu'est-ce qui est écrit dans quel livre et quelle est la relation avec les autres livres?"

"Vérifiez la position debout de ce livre" "Si c'est un livre de séries chronologiques, ce livre est en Akan" S'il vous plaît laissez-moi savoir si vous en avez.

Cet article a un concept similaire au Guide du livre pour l'analyse des séries temporelles.

"Quel est le meilleur, python ou R?" Pour les données de séries chronologiques

--Python et R ont tous deux de nombreux packages de bibliothèques d'analyse de données, et la vitesse du papier à la mise en œuvre est rapide.

De ce qui précède, si vous souhaitez apprendre des séries chronologiques, nous vous recommandons de choisir le langage R.

Titre du livre et aperçu

11 livres - en avril 2020

Je vais voler vers Amazon, mais n'hésitez pas à y faire référence car il n'inclut pas les revenus publicitaires pour moi.

indice Titre La description code Auteur / Publication
1er livre Analyse empirique VAR apprise en R Modèledesériechronologiqueetenparticulierauto-retourvectoriel(VAR)Un livre pour comprendre l'utilisation de la fonction VAR de R, etc. R Hiroshi Murao:Ohm
2ème livre Apprentissage automatique des finances Un bon livre qui explique les méthodes d'analyse et les idées liées à la finance tout en implémentant des fonctions en python python Marcos Lopez de Prado:Groupe d'étude sur la situation financière et financière
3e livre Économie quantitative Un livre qui combine la «modélisation de séries chronologiques» avec le «dictionnaire de savoir-faire pour l'analyse de données» qui explique soigneusement avec des figures et des formules mathématiques afin qu'il soit convivial non seulement pour l'analyse et la modélisation de séries chronologiques, mais aussi pour la science des données naissante. Aucun Yoshihiko Nishiyama:Yukaku
4e livre Bases de l'analyse des séries chronologiques et du modèle d'espace d'états Apprenezlemodèled'espaced'étatenutilisantRetstan.Encommençantparlemodèleleplussimple,étapeparétapeVAR,Unlivrequivouspermetd'apprendremêmelesmodèlesd'espaced'état.Blogsurlesstatistiquesetlessérieschronologiquesfacileàcomprendre"LogicsofBlue"aveccodeLivre de l'auteur R Shinya Baba:Éditions Pléiades
5ème livre Analyse des séries chronologiques de pesée des données économiques et financières Un livre avec une théorie forte. J'ai choisi ce livre comme premier livre, mais j'ai été déçu. Modélisation de séries chronologiques d'introduction Après avoir appris dans le livre, il est bon de l'utiliser pour compléter la théorie. Aucun Ryuyoshi Okimoto:Librairie Asakura
6ème livre Analyse de données chronologiques utilisables immédiatement sur le terrain Un livre où vous pouvez apprendre des techniques de modélisation de séries chronologiques simples et basiques à l'aide de R. En raison de sa simplicité, il est indéniable qu'il peut être couvert par d'autres livres de séries chronologiques. R Daisuke Yokouchi:Société d'examen technique
7e livre Analyse des séries chronologiques du processus ponctuel Un livre sur la distribution de probabilité et une certaine modélisation utilisée pour l'analyse des séries chronologiques. Il peut être bon de l'appeler un dictionnaire. La priorité est faible. Aucun Takahiro Omi:Éditions Kyoritsu
8ème livre Analyse économique métrique par R Un livre qui présente les modèles à retour automatique à GARCH et VAR, en commençant par l'opération de R. Étant donné que le nombre de feuilles est petit, il est recommandé à ceux qui souhaitent gérer la modélisation de séries chronologiques pour le moment. R Junichiro Fukuchi:Librairie Asakura
9e livre Économie métrique pour l'analyse empirique D'autres livres incluent le contenu de la modélisation prédictive, mais en premier lieu, il est important de vérifier que la science des données est "efficace? Inclut-elle des biais? Le coefficient est-il significatif?" Un livre qui m'a rappelé. "Analyse empirique" où vous apprenez tout en utilisant des problèmes du monde réel. Ce livre n'est pas une modélisation de séries chronologiques, mais il est recommandé aux débutants en analyse de données. Aucun Isao Yamamoto:Chuo Keizaisha
10ème livre Analyse des séries chronologiques à partir des bases Comme vous pouvez le voir du fait que le sous-titre a un filtre et MCMC, il s'agit d'un livre spécialisé dans les modèles d'espace d'état. La modélisation du système de retour automatique n'est qu'une introduction. Un livre qui explique avec plein de chiffres et de codes. Il peut être préférable de bouger d'abord vos mains plutôt que de presser des formules et des théories. R Junichiro Hagiwara:Société d'examen technique

À propos des méthodes et des types de prédiction de séries chronologiques

Les méthodes utilisées pour prédire les données de séries chronologiques, y compris la modélisation de séries chronologiques, peuvent être globalement divisées en quatre méthodes (** arbitrairement **).

  1. Système d'auto-retour
  2. Système spatial d'État
  3. Retour de l'apprentissage automatique
  4. Apprentissage en profondeur

1. Système d'auto-retour

AR, ARMA, ARIMA, SARIMA, ARIMAX, SARIMAX, ARCH, GARCH, VAR

Il s'agit d'un groupe de méthodes de modélisation de séries chronologiques qui existent depuis longtemps et qui ne sont pas suffisamment obsolètes pour être utilisées même à l'époque moderne.

Les données de séries temporelles sont exprimées en fonction en les décomposant en plusieurs composantes telles que «tendance (tendance)», «auto-corrélation (cycle)», «saison (cycle périodique)» et «erreur». Méthode.

image.png

↑ Il est décomposé comme ceci (le chiffre est la sortie du prophète).

Afin de décomposer les données en ces composants, une ingénierie telle que ** retour automatique, test de racine unitaire, différence d'ordre d, sélection de modèle par AIC **, etc. est nécessaire.

Cela peut sembler difficile, mais à l'époque moderne, les obstacles sont faibles car la modélisation des systèmes d'auto-retour est essentiellement automatisée. Cependant, des connaissances théoriques sont également nécessaires pour «comprendre et considérer» les résultats de la modélisation.

Si vous ne savez pas "quel type de théorie est utilisé pour le calcul" ・ Le modèle est-il erroné suite à une détermination automatique? ・ S'agit-il de données qui peuvent être modélisées par retour automatique en premier lieu? Vous oublierez des parties importantes telles que.

(La lecture de plusieurs livres m'a rappelé l'importance de comprendre la théorie de l'apprentissage automatique.)

2. Système spatial d'État

Nous modéliserons les données de séries chronologiques sur la base de l'idée qu'elles peuvent être obtenues en «ajoutant de manière probabiliste une valeur» à une valeur numérique appelée «état». Considérons deux formules, «l'équation d'observation» et «l'équation d'état». En essayant de modéliser la température au Japon, nous pouvons d'abord considérer la forme d'onde périodique des étés chauds et des hivers froids.

Cependant, un été il y avait beaucoup de pluie et la température moyenne baissait.

Lorsque la forme d'onde périodique est traitée comme un modèle de température japonais, de tels changements ne peuvent pas être prévus, mais Si la forme d'onde est corrigée à partir de l'enregistrement "s'il a plu", la diminution de la température peut être reflétée. C'est une méthode de création d'un modèle basé sur l'idée.

"Il a plu?" Ici est créé comme une équation exprimant "l'état". Puisqu'on considère que "l'état" affecte les données, il y a un avantage qu'il devient plus facile d'expliquer le changement en vérifiant la valeur de l'état lorsqu'on considère "pourquoi la valeur a été atteinte".

Le mot «filtre» qui apparaît dans le modèle d'espace d'états fait référence à l'algorithme utilisé pour créer et corriger des «états». Dans le processus de création d'un modèle d'espace d'états, la fonction de densité de probabilité qui correspond à la probabilité postérieure devient compliquée, et il est nécessaire de générer un nombre aléatoire par MCMC afin d'estimer le paramètre.

3. Retour de l'apprentissage automatique

Il existe un modèle de régression en tant que méthode d'apprentissage automatique. Il s'agit d'une méthode de prédiction de valeurs numériques à l'aide de variables explicatives périphériques et de points de temps passés, au lieu de la modélisation de séries chronologiques. Autrefois, des méthodes telles que SVM (SVR) et récemment GBDT et LightGNM ont été actives dans des concours d'analyse de données, etc., et ont un large éventail d'applications telles que «résoudre des problèmes de classification, calculer rapidement et gérer des multivariés». J'ai l'impression qu'il est utilisé avec désinvolture.

Si vous connaissez la modélisation de séries chronologiques, connaissez la théorie et qu'elle est facile à formuler, sélectionnez la modélisation de séries chronologiques. Si vous trouvez qu'il est multivarié ou difficile à formuler, essayez de revenir avec un autre modèle d'apprentissage automatique.

N'est-ce pas une bonne approche?

Lisez le livre de séries chronologiques afin de pouvoir décider de choisir la modélisation de séries chronologiques. Si vous souhaitez en savoir plus sur l'apprentissage automatique (classification / régression), je vous présenterai les livres suivants.

indice Titre La description code Auteur / Publication
11e livre Technologie d'analyse de données qui gagne avec Kaggle Un livre cohérent sur la façon d'utiliser les techniques utilisées dans la compétition kaggle python Daisuke Kadowaki:Société d'examen technique

4. Apprentissage en profondeur

Lors de l'utilisation de l'apprentissage en profondeur pour les données en série, RNN et le LSTM amélioré sont souvent utilisés. Parfois, dans le cas de multivarié, il peut être résolu comme une régression avec NN multicouche à partir de l'idée introduite dans "3. Régression de l'apprentissage automatique". C'est un problème courant dans l'apprentissage en profondeur, mais cela peut être un problème lorsqu'on lui demande d'expliquer les valeurs prédites.

Je n'ai pas encore de connaissances sur les livres que je peux présenter, je vais donc l'omettre. (Un livre comme M. Negago est-il bon? Nous attendons la recommandation du livre)

Si vous lisez 11 livres et que vous vous donnez des conseils au début

Si vous souhaitez le recommander à un débutant complet qui commencera à l'avenir la modélisation / l'analyse de séries chronologiques, procédez comme suit. Je n'ai pas pensé à la "prédiction (retour) avec un modèle d'apprentissage automatique" ici, mais j'ai juste pensé à un moyen de comprendre la "modélisation de séries temporelles".

--Basics of time series analysis and state space model (cover of Hayabusa)

Je pense que vous avez assez de pouvoir pour vous battre en utilisant la méthode de modélisation des séries chronologiques jusqu'à présent.

Pour plus de progrès et de croissance

Si vous lisez d'un débutant à une politique que vous souhaitez développer

c'est tout

Jusqu'à présent, j'ai lu les livres de séries chronologiques et réfléchi à leurs impressions, critiques de livres et recommandations.

・ «L'analyse des données de séries chronologiques pouvant être utilisées immédiatement sur le terrain» est pour l'essentiel, et j'estime que la priorité est faible car il y a peu d'introductions de méthodes de modélisation de séries chronologiques probablement parce qu'elles sont anciennes. ・ Bien que "Measurement Economic Analysis by R" soit un vieux livre, il existe de nombreuses méthodes de modélisation de séries chronologiques à traiter, et des méthodes d'opération de base R sont également décrites, j'ai donc pensé qu'elle pourrait être absorbée dans de nombreux cas, j'ai donc un peu augmenté la priorité.

J'espère que cela vous aidera dans votre apprentissage.

Recommended Posts

J'ai lu 10 livres liés aux données de séries chronologiques, je vais donc rédiger une critique.
J'ai lu 13 livres qui relient la science des données aux résultats commerciaux, je vais donc rédiger une critique.
Comment lire les données de séries chronologiques dans PyTorch
J'ai lu un article d'enquête sur la détection d'anomalies dans les séries chronologiques, je vais donc le résumer.
J'ai créé un package pour filtrer les séries chronologiques avec python
<Pandas> Comment gérer les données de séries chronologiques dans le tableau croisé dynamique
Présentation de livres liés à la science des données.
matplotlib Ecrire du texte dans un graphique de séries chronologiques
Comment gérer les données de séries chronologiques (mise en œuvre)
Livres sur la science des données à lire en 2020
Je n'ai pas le temps, puis-je simplement poser une question? feat. API COTOHA
Je veux faire du machine learning même sans serveur - Time Series Edition -
Je n'ai pas eu besoin d'écrire décorateur en classe Merci contextmanager
Pourquoi Python doit-il écrire un deux-points?
J'ai lu "Comment créer un laboratoire de piratage"
Je veux écrire dans un fichier avec Python
Chaque fois que j'essaye de lire un fichier csv en utilisant des pandas, j'obtiens une erreur numpy.