[PYTHON] Une méthode d'étude pour les débutants pour apprendre l'analyse des séries chronologiques

Lors de ma session d'étude d'ingénieur personnel 2019 Calendrier de l'Avent, "Introduction aux statistiques bayésiennes pour les débutants en statistique J'ai écrit un article "Comment étudier jusqu'à ce que vous le fassiez" et il a été très bien accueilli.

Donc, cette fois, je voudrais écrire sur les études pour les débutants en statistiques pour apprendre l'analyse de séries chronologiques.

Objectif et public cible de cet article

Cet article vise à aider ceux qui ont étudié les bases de la statistique dans une certaine mesure à être en mesure de parler avec éloge du grand sujet des statistiques de «l'analyse des séries chronologiques».

L'objectif de cet article est de pouvoir donner un aperçu de l'analyse des séries chronologiques.

Même dans l'analyse de séries chronologiques, le but est de pouvoir comprendre le modèle analytique appelé ** modèle d'espace d'états **.

Les livres présentés ici sont des livres que vous pouvez apprendre en bougeant vos mains, donc la connaissance de la programmation est essentielle.

Qu'est-ce que l'analyse de séries chronologiques?

Que sont les données de séries chronologiques?

L'analyse des séries chronologiques, comme son nom l'indique, est une série de données qui intègre le concept de temps.

Le monde regorge de données chronologiques. Je me demande s'il n'y a vraiment pas de données qui n'incluent pas le concept d'axe des temps! ?? Je pense même ça. Parce que lorsque vous lancez un dé 10 000 fois (pas à ce moment-là), le temps passe. Cependant, ce ne sont pas les données des séries chronologiques qui essaient d'ignorer l'axe du temps, comme lors du lancement d'un dé 10 000 fois.

Un exemple typique de données chronologiques est le cours des actions.

400px-Nikkei_225(1970-).svg.pn g [Nikkei Average Stock Price wikipedia](https://ja.wikipedia.org/wiki/%E6%97%A5%E7%B5%8C%E5%B9%B3%E5%9D%87%E6%A0%AA% E4% BE% A1) (Je peux le sentir visuellement, ** la période de forte croissance économique ** ...)

Certaines personnes peuvent penser que "l'analyse de séries chronologiques est un traitement du langage naturel !!". Certes, le traitement du langage naturel est l'une des analyses de séries chronologiques les plus remarquables en raison du développement récent de l'apprentissage automatique. Toutes les personnes "Alexa, qu'est-ce que l'analyse des séries chronologiques?" Quand j'ai parlé de l'élégant intérieur cylindrique, "Wow, ◯ su !!" La réponse est due au développement de la technologie de traitement du langage naturel.

Cependant, nous n'osons pas traiter ici du traitement du langage naturel, mais uniquement pour des données chronologiques plus générales telles que les cours des actions et les données de vente.

Thèmes d'analyse de séries chronologiques et modèles d'espace d'états

Pour une vue d'ensemble de ce qu'est l'analyse de séries chronologiques Ceci est le livre de "Bases de l'analyse des séries temporelles et du modèle d'espace d'état: théorie et mise en œuvre apprises avec R et Stan", qui sera présenté plus tard. Il est décrit en détail dans le blog de M. Baba logic of blue. (Il n'est pas exagéré de dire que le contenu de cet article est inclus dans le contenu de ce blog ...)

Le modèle d'espace d'états est, très grosso modo, une sorte de modèle statistique qui suppose un «état» invisible. Les valeurs observées ne sont que les résultats produits par l'état. A partir de l'état x t </ sub> avant le point t-1, l'état x t </ sub> au point t est généré. La valeur observée y t </ sub> est générée à partir de l'état x t </ sub> à cet instant t.

Dans Hayashimoto (p.179) ci-dessus, dans l'exemple de la pêche, Le nombre de poissons dans le lac un jour est l'état, et le nombre de poissons capturés ce jour-là est la valeur observée.

Encore une fois, comme dans cet exemple, il s'agit d'une valeur d'observation avec un état. Cependant, comme nous ne connaissons pas l'état, nous n'avons pas d'autre choix que de deviner à partir des valeurs observées.

C'est un sujet de statistique car il traite statistiquement des états et des observations, contrairement aux modèles d'espace d'états, ce qu'on appelle l'apprentissage automatique général.

Il a une certaine histoire, mais ces dernières années c'est un modèle statistique dont on parle souvent dans le cadre des statistiques bayésiennes. (Pour plus d'informations sur la manière d'étudier les statistiques bayésiennes, veuillez consulter l'article au début.)

Méthode d'étude

Bases de l'analyse des séries chronologiques

Dans l'analyse des séries chronologiques, le modèle d'espace d'états est un modèle difficile, pas une méthode «classique».

Comme base pour l'analyse de séries chronologiques, il est recommandé d'apprendre d'abord les méthodes "classiques" telles que le modèle ARMA pour obtenir une image.

Il est recommandé d'obtenir une atmosphère rude

51mEuEErMJL.SX352_BO1,204,203,200.jpg

『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識』です。

Les formules sont également faciles, vous pouvez donc les lire rapidement et vous en faire une idée.

Saisir l'image du modèle d'espace d'états

Si vous pouvez avoir une idée de l'analyse des séries chronologiques, alors Hayato!["Bases de l'analyse des séries chronologiques et du modèle d'espace d'état: théorie et implémentation apprises avec R et Stan"](https://www.amazon.co.jp/ Accédez à dp / 4903814874 / ref = cm_sw_em_r_mt_dp_U_2qr2EbRBTCTC5).

516f3jVjO2L.SX353_BO1,204,203,200.jpg

La grande chose à propos de Hayashimoto est qu'il explique l'image du modèle d'espace d'états sans utiliser de formules mathématiques. C'est quelque chose que de merveilleux livres sur les statistiques et l'apprentissage automatique ont en commun, mais en communiquant des images avec des mots, la théorie qui a tendance à être sèche prend vie.

L'explication de la partie 5 du filtre de Kalman et du lissage par la méthode d'estimation la plus probable, qui est le sommet de ce livre, est un chef-d'œuvre. La sixième partie finale traite également de l'estimation des modèles d'espace d'états par inférence bayésienne.

Hayato est également déçu par la capacité de réflexion abstraite et la capacité de verbalisation de M. Baba. J'adorerais te voir une fois.

Comprendre le modèle d'espace d'états plus en détail mathématiquement

Une fois que vous avez "complètement compris le modèle d'espace d'état" dans Hayashimoto, passons au monde mathématique plus dur.

RecommandéAnalyse des séries temporelles à partir du filtre basics-Kalman, MCMC, filtre à particules pratiqué dans R

517UNNmUFtL.SX396_BO1,204,203,200.jpg

C'est un si bon livre que je ne comprends pas pourquoi certaines personnes lui attribuent une mauvaise note. Cependant, cela peut être un obstacle majeur pour le premier modèle d'espace d'état. De plus, comme l'histoire est développée dans les statistiques bayésiennes depuis le début, cela peut être difficile si vous ne connaissez pas Bayes.

Si vous vous mettez au défi dans un état «complètement compris», vous serez emmené dans le monde du «je ne sais rien». Cependant, si vous le lisez dans les deux sens avec Hayashimoto, vous serez en mesure de comprendre profondément le modèle d'espace d'état dans le vrai sens du mot. En regardant en arrière le filtre de Kalman appris à Hayashimoto du point de vue statistique bayésien de ce livre, il y a un lien très profond ...

Résumé

L'analyse des séries chronologiques est un sujet majeur en statistique, mais je pense que c'est encore un domaine inconnu. Le monde regorge de séries chronologiques. Est-ce parce que c'est difficile?

La clé de l'analyse des séries chronologiques est que l'avenir est créé à partir du passé. Et le passé et le futur sont en quelque sorte similaires.

Ça tourne autour Les temps se retournent

Recommended Posts

Une méthode d'étude pour les débutants pour apprendre l'analyse des séries chronologiques
[Pour les débutants] Comment étudier le test d'analyse de données Python3
LSTM (1) pour la prédiction de séries chronologiques (pour les débutants)
Détection d'anomalies de données chronologiques pour les débutants
Python: analyse des séries temporelles: création d'un modèle SARIMA
Comment utiliser les outils d'analyse de données pour les débutants
[Pour les débutants] Comment étudier la programmation Mémo privé
Python: analyse des séries chronologiques
Analyse des séries chronologiques RNN_LSTM1
Analyse des séries chronologiques 1 Principes de base
Python 3.4 Créer un environnement Windows7-64bit (pour l'analyse des séries chronologiques financières)
Je souhaite créer une base de données de déjeuners [EP1] Django pour la première fois
Je souhaite créer une base de données de déjeuner [EP1-4] Django pour la première fois
Expérience de collecte de tweets pendant une longue période (préparation du programme (3))
Expérience pour collecter des tweets pendant une longue période (préparation du programme (1))
J'ai créé un package pour filtrer les séries chronologiques avec python
Défi des prévisions de ventes futures: ② Analyse des séries chronologiques à l'aide de PyFlux
Méthode d'apprentissage TensorFlow pour les professionnels des arts libéraux et les débutants en Python
Expérience pour collecter des tweets pendant une longue période (préparation du programme (2))
Expérience pour collecter des tweets pendant une longue période (préparation du programme (5))
Analyse des séries chronologiques partie 4 VAR
Analyse de séries chronologiques Partie 3 Prévisions
Défi des prévisions de ventes futures: ⑤ Analyse des séries chronologiques par Prophet
~ Conseils pour les débutants de Python présentés avec amour par Pythonista ③ ~
Analyse de séries chronologiques Partie 1 Autocorrélation
Création d'une méthode pour sous-échantillonner les données non équilibrées (pour la classification binomiale)
Défi pour les prévisions de ventes futures: ① Qu'est-ce que l'analyse des séries chronologiques?
Je veux créer un Dockerfile pour le moment.
[Version 2020 pour les débutants] Méthode d'étude recommandée pour ceux qui souhaitent devenir eux-mêmes ingénieur en IA
Expérimentez pour collecter des tweets pendant une longue période (juste avant l'exécution)
<Pandas> Comment gérer les données de séries chronologiques dans le tableau croisé dynamique
Il est maintenant temps d'installer DB avec Docker! Installation de la base de données pour les débutants sur Docker
Python: analyse des séries chronologiques: prétraitement des données des séries chronologiques
Analyse des séries chronologiques
Statistiques de mouvement pour la prédiction de séries chronologiques
Analyse des séries chronologiques 3 Prétraitement des données des séries chronologiques
Comment étudier pour le test G de Deep Learning Association (pour les débutants) [version 2020]
[Pour les débutants] Script dans les 10 lignes (5. Rééchantillonnage des données de séries chronologiques à l'aide de pandas)
Conseils aux débutants en Python pour utiliser l'exemple Scikit-image pour eux-mêmes 3 Écrire dans un fichier
(Version préservée: mise à jour de temps en temps) Une collection de tutoriels utiles pour les hackathons d'analyse de données par Team AI
Analyse des séries chronologiques 2 Stabilité, modèle ARMA / ARIMA
[Python] Compte-rendu de la réunion d'étude pour les débutants (7/15)
Comment comparer des données de séries chronologiques - Dérivée DTW, DTW-
Analyse des séries chronologiques 4 Construction du modèle SARIMA
matplotlib Ecrire du texte dans un graphique de séries chronologiques
Les débutants lisent "Introduction à TensorFlow 2.0 pour les experts"
Comment gérer les données de séries chronologiques (mise en œuvre)
Analyse des séries chronologiques n ° 6 Faux retour et partie républicaine
Un manuel pour les débutants réalisé par des débutants Python
Expérimentez pour collecter des tweets pendant une longue période (agrégation et confirmation du contenu)
Ce que j'ai pensé et appris à étudier pendant 100 jours dans une école de programmation
Introduction à l'analyse des séries temporelles ~ Modèle d'ajustement saisonnier ~ Implémenté en R et Python
Défi des prévisions de ventes futures: ④ Analyse des séries chronologiques en tenant compte de la saisonnalité par Stats Models
Je veux faire du machine learning même sans serveur - Time Series Edition -
Un mémorandum de méthode souvent utilisé lors de l'analyse de données avec des pandas (pour les débutants)
Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)