[PYTHON] Durchschnittliche Schätzung der begrenzten Daten

Problemstellung

eine Formel

Es kann erhalten werden, so dass die Wahrscheinlichkeit, der geschätzte Wert zu werden, maximiert wird. Insbesondere die folgende Gleichung. Im Falle eines Defekts wird jedoch davon ausgegangen, dass die Obergrenze erreicht wurde.

$ Ursprünglicher Durchschnitt = \ frac {Summe aller Daten} {Anzahl der Daten - Anzahl der erreichten Obergrenzen} $

Fragen Sie bei Python nach

python3


import numpy as np
np.random.seed(1)
n = 100000 #Die Anzahl der Daten
a = np.random.exponential(3, n) #Originalverteilung
print('Durchschnitt der ursprünglichen Verteilung%.3f'%a.mean())
b = np.random.uniform(2, 10, n) #Höchstgrenze
c = np.min((a, b), 0) #Verteilung mit Obergrenze
nn = (c==b).sum() #Anzahl erreichte die Obergrenze
print('Geschätzter Durchschnitt der ursprünglichen Verteilung%.3f'%(c.sum()/(n-nn)))
>>>
Durchschnitt der ursprünglichen Verteilung 2.996
Geschätzter Durchschnitt der ursprünglichen Verteilung 2.996

das ist alles

Recommended Posts

Durchschnittliche Schätzung der begrenzten Daten
Vorverarbeitung von Präfekturdaten
Auswahl der Messdaten
Python: Diagramm der zweidimensionalen Datenverteilung (Schätzung der Kerneldichte)
Visualisierung von Daten nach Präfektur
Fourier-Transformation von Rohdaten
Über die Datenverwaltung von Amboss-App-Server
Wahrscheinlichkeitsvorhersage von unausgeglichenen Daten
Differenzierung von Zeitreihendaten (diskret)
10 Auswahlen der Datenextraktion durch pandas.DataFrame.query
Animation von Geodaten durch Geopandas
Empfehlung zur Datenanalyse mit MessagePack
Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Datenverarbeitung 2 Analyse verschiedener Datenformate