[PYTHON] La probabilité de précipitation est-elle correcte?

La probabilité de précipitation est-elle correcte?

La probabilité peut être calculée en comptant et en divisant. Cependant, en ce qui concerne la probabilité de précipitations. Le même jour ne reviendra jamais et la probabilité de précipitations varie d'un jour à l'autre. Quelle est la fiabilité de la probabilité de précipitations? N'est-ce pas simplement donner les chiffres de manière appropriée? Même si la probabilité de précipitations est de 90%, il y a des jours où il ne pleut pas. Ce n'est pas à 100%, donc ce n'est pas étrange. Cependant, «ce n'est pas 100%, donc ce n'est pas une erreur si ce n'est pas de la pluie» ne veut rien dire. Était-ce vraiment 90% un jour ensoleillé avec 90% de chances de pluie?

Par exemple, si la probabilité de précipitations est de 30% par jour, la validité peut être vérifiée.

Si la probabilité de précipitations est la même tous les jours, la probabilité de précipitations peut être vérifiée en enregistrant s'il y avait du soleil ou de la pluie tous les jours et en comptant les jours où il pleuvait. Il est obtenu par un test binomial ou un test du chi carré.

Si le nombre qui apparaît comme la probabilité de précipitation est fini et que le nombre est inférieur au nombre d'échantillons, il peut être obtenu.

De plus, je voudrais supposer qu'il n'y a pas de probabilité de précipitations rares, ou s'il y en a, il y a un nombre suffisant d'échantillons même si cela est pris en considération. Quoi qu'il en soit, si le nombre d'échantillons est fini et que le nombre d'échantillons est suffisant, il est possible de créer des données qui "le jour où cette probabilité de précipitation est prédite, il pleuvra avec un certain pourcentage de probabilité". Et la probabilité de précipitation annoncée par l'Agence météorologique est en fait décidée par incréments de 10% de 0% à 100%. Cette méthode semble fonctionner. (Même si ce n'est pas le cas, il existe un moyen de diviser de force les données par incréments de 10% et de le faire)

Définition de la probabilité de précipitation

Extrait de page de terminologie des prévisions de l'Agence météorologique.

a) La valeur moyenne de la probabilité (%) de précipitations de 1 mm ou plus dans la zone de prévision sur une certaine période de temps, exprimée comme 0, 10, 20, ..., 100% (arrondie pendant cette période) Faire). b) Probabilité de précipitation 30% signifie que lorsqu'une prévision de 30% est annoncée 100 fois, environ 30 d'entre eux ont des précipitations de 1 mm ou plus, et cela ne permet pas de prédire la quantité de précipitations. La probabilité de précipitation est la probabilité que la pluie ou la neige de 1 mm ou plus (convertie en quantité de précipitations lors de la fonte) tombe dans un certain temps dans la zone de prévision, et elle est annoncée par incréments de 10% de 0% à 100%. À.

Vous devez également faire attention à cela.

Le temps cible est de 6 heures pour les prévisions à court terme et de 24 heures pour les prévisions hebdomadaires.

La définition de la probabilité de précipitation à court terme dans la colonne météo aujourd'hui et la probabilité de précipitation quotidienne dans la colonne de prévision hebdomadaire étaient différentes. Le premier a une probabilité de tomber de 1 mm ou plus en 6 heures et une probabilité de tomber de 1 mm ou plus en 24 heures. Je ne savais pas.

Données passées de l'Agence météorologique

Vous pouvez consulter les données météorologiques passées sur http://www.data.jma.go.jp/obd/stats/etrn/ Vous pouvez le télécharger à l'adresse http://www.data.jma.go.jp/gmd/risk/obsdl/index.php. Je vous suis reconnaissant de l'avoir rendu public gratuitement.

J'ai pu obtenir la quantité de précipitations par jour. Cependant, malheureusement, la probabilité de précipitation prévue ne semble pas être divulguée.

Données historiques de la probabilité de précipitations

Sur cette page web, vous pouvez voir les prévisions météo passées pour Tokyo (pour les particuliers?). http://homepage3.nifty.com/i_sawaki/WeatherForecast/ Incroyable ...

Les données sont complètes. essayons

Pour le moment, j'ai collecté des données du 1er janvier 2014 au 31 décembre 2014 sur le site ci-dessus. Pour la probabilité de précipitations, nous avons utilisé la valeur d'il y a deux jours, qui est la plus récente des probabilités de précipitations quotidiennes.

Comment exprimer quantitativement la condition de hit?

La validité de chaque probabilité de précipitation peut être trouvée par le test du chi carré, mais je voudrais demander quelle est la situation générale. Pour cette raison, il s'appelle cette fois "Decision Factor" J'ai essayé d'utiliser quelque chose. Selon Wikipédia, il existe différentes théories dans la définition, mais on dit qu'elle est générale. R^2 = 1-\frac{\Sigma_i(y_i-f_i)^2}{\Sigma_i(y_i-\overline{y})^2} Ça a été utilisé. Le coefficient de décision est utilisé pour voir dans quelle mesure la courbe de régression s'adapte, et plus le nombre est élevé, meilleur est l'ajustement, avec un maximum de 1. Cela peut également être une valeur négative dans cette définition.

Cette fois est différente de la courbe de régression, ($ x_i $, $ y_i $) = (Probabilité de précipitations prévues, nombre de jours de pluie au moment de la prévision / nombre de jours où la prévision est sortie) Et la valeur estimée était $ f_i = x_i $.

Le code écrit en Python (qui devrait fonctionner à la fois en 2 et en 3) est posté dans par ici.

Quel est le taux de précipitations atteint en 2014?

Voici la distribution des probabilités de précipitations en 2014. スナップショット8.jpeg Ici, l'axe horizontal représente la prévision de la probabilité de précipitations, et l'axe vertical représente le nombre de jours de pluie au moment de la prévision / le nombre de jours où la prévision a été émise. スナップショット7.jpeg La valeur du coefficient de détermination à ce moment était de 0,8714.

Si vous recherchez par «directive de coefficient de décision», etc., il semble qu'il n'y ait pas de norme selon laquelle il devrait être supérieur à 0,5, mais il semble que 0,5 ou plus soit une régression suffisamment bonne. Je pense que 0.8714 est un très bon rapport qualité / prix.

Il s'est avéré que la probabilité de précipitations n'était pas un gâchis.

Recommended Posts

La probabilité de précipitation est-elle correcte?
Tweetez la probabilité de précipitations dans le cadre de la fonction de bot
Science "Saito est-il le représentant de Saito?"
Quelle est la cause de l'erreur suivante?
[python] [meta] Le type de python est-il un type?
La barre oblique arrière du clavier japonais est "ro"
Battre la fonction de densité de probabilité de la distribution normale
La réponse de "1/2" est différente entre python2 et 3
L'origine de Manjaro Linux est "Mount Kirimandjaro"
FAQ: Pourquoi la comparaison des nombres est-elle incohérente?
La valeur de pyTorch torch.var () n'est pas distribuée
J'ai essayé de corriger la forme trapézoïdale de l'image
Ceci est le seul examen de base de Python ~ 1 ~
Ceci est le seul examen de base de Python ~ 2 ~
Calculer la probabilité de valeurs aberrantes sur les moustaches de la boîte
Ceci est le seul examen de base de Python ~ 3 ~
Cours ROS 119 Corriger la couleur de l'image de la caméra
Le début de cif2cell
[Remarque] Corrigez l'orientation des cristaux liquides du M5 Stick V
Autour de l'endroit où la valeur d'Errbot est stockée
Le sens de soi
le zen de Python
L'histoire de sys.path.append ()
Le problème Zip 4 Gbyte est une histoire du passé
Qu'est-ce qu'un moteur de recommandation? Résumé des types
Quand vous pensez que la mise à jour de ManjaroLinux est étrange
Pourquoi le premier argument de la classe [Python] est-il self?
Vérifiez la nature atrophique de la distribution de probabilité en Python
La vengeance des types: la vengeance des types
La méthode de copie de pandas.DataFrame est une copie profonde par défaut
Quelle est la version TLS par défaut du module de requêtes python?
La fonction d'affichage d'image d'iTerm est pratique lors du traitement d'images.
Installation des paramètres initiaux Mac-Python (pyenv) au plus vite
Méthode d'approximation numérique lorsque le calcul de la dérivée est gênant
Y a-t-il un secret dans la fréquence des nombres de rapport de circonférence?
La loterie est-elle rentable? ~ LOTO7 et la loi des grands nombres ~
Aligner la version de chromedriver_binary
[Python] Utilisation correcte de la carte
Grattage du résultat de "Schedule-kun"
10. Compter le nombre de lignes
L'histoire de la construction de Zabbix 4.4
Vers la retraite de Python2
Quelle est la fonction d'activation?
Comparez les polices de jupyter-themes
Obtenez le nombre de chiffres
Expliquez le code de Tensorflow_in_ROS
Réutiliser les résultats du clustering
GoPiGo3 du vieil homme
Calculez le nombre de changements
Changer le thème de Jupyter
La popularité des langages de programmation
Changer le style de matplotlib
Visualisez la trajectoire de Hayabusa 2
À propos des composants de Luigi
Composants liés du graphique
Filtrer la sortie de tracemalloc