[PYTHON] Estimation moyenne des données plafonnées

Problème de réglage

une formule

Il peut être obtenu de sorte que la probabilité de devenir la valeur estimée soit maximisée. Plus précisément, l'équation suivante. Cependant, en cas de défaut, on considère que la limite supérieure est atteinte.

$ Moyenne d'origine = \ frac {total de toutes les données} {nombre de données-nombre de plafonds atteints} $

Vérifier avec Python

python3


import numpy as np
np.random.seed(1)
n = 100000 #Le nombre de données
a = np.random.exponential(3, n) #Distribution originale
print('Moyenne de la distribution originale%.3f'%a.mean())
b = np.random.uniform(2, 10, n) #limite supérieure
c = np.min((a, b), 0) #Distribution avec limite supérieure
nn = (c==b).sum() #Le nombre a atteint la limite supérieure
print('Moyenne estimée de la distribution d'origine%.3f'%(c.sum()/(n-nn)))
>>>
Moyenne de la distribution originale 2.996
Moyenne estimée de la distribution originale 2.996

c'est tout

Recommended Posts

Estimation moyenne des données plafonnées
Pré-traitement des données préfectorales
Sélection des données de mesure
Python: Diagramme de distribution de données bidimensionnelle (estimation de la densité du noyau)
Visualisation des données par préfecture
Transformée de Fourier des données brutes
À propos de la gestion des données d'Anvil-App-Server
Prédiction de probabilité de données déséquilibrées
Différenciation des données de séries chronologiques (discrètes)
10 sélections d'extraction de données par pandas.DataFrame.query
Animation des géodonnées par geopandas
Recommandation d'analyse des données à l'aide de MessagePack
Analyse des séries chronologiques 3 Prétraitement des données des séries chronologiques
Traitement des données 2 Analyse de divers formats de données