[PYTHON] [Statistiques] Un ingénieur ordinaire a commencé à étudier les statistiques-part2

introduction

Les mathématiques sont un peu dekill Ingénieur backend ordinaire L'histoire de l'étude des statistiques

Dernière fois


Que faire cette fois

Utilisez le bloc-notes Jupyter pour calculer diverses statistiques.

· Valeur totale ·Valeur moyenne ・ Dispersion d'échantillon ・ Dispersion impartiale ·écart-type ·valeur minimum ·Médian ·Valeur maximum


Bibliothèque utilisée cette fois

import numpy as np
import scipy as sp

Exemple de données

#Essayez des statistiques descriptives sur le thème des données sur les poissons
fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

Calculez la valeur totale

Passez le tableau fish_data à la méthode sum du module scipy. Stocker le résultat dans sum_value

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])
#Valeur totale(sum_value)Éteindre
sum_value = sp.sum(fish_data)


Anecdote sur la valeur totale (colonne)

Parce que je ne peux pas faire d'éducation physique un jour de pluie, le professeur Un nombre de 1 à 100 pour un garçon Où j'ai imposé tous les ajouts Il n'a fallu que quelques dizaines de secondes pour calculer et produire des résultats.

Vous connaissez tous ce garçon M. Gauss, qui est devenu plus tard un grand homme dans les domaines des mathématiques et de la physique.


Calculez le nombre d'échantillons

Il peut être calculé en mesurant la longueur du tableau.

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Compter le nombre d'échantillons N
N = len(fish_data)

Calculez la valeur moyenne

Il peut être calculé par la valeur totale / le nombre d'échantillons. Il peut être calculé par la méthode moyenne en utilisant scipy.

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Somme à la moyenne_value / N
avg = sp.mean(fish_data)

Calculer la variance de l'échantillon

Un index qui indique "l'écart entre les données et la valeur moyenne"

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Somme à la moyenne_value / N
avg = sp.mean(fish_data)

#La variance de l'échantillon est «Sample variance» en anglais
sigma = sp.sum((fish_data - avg)**2) / N

Calculer la variance de l'échantillon (2)

Vous pouvez facilement calculer la variance de l'échantillon à l'aide de scipy.

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Calculer la variance sigma de l'échantillon
# (Peut être calculé en un seul coup en utilisant la méthode var de scipy)
sigma = sp.var(fish_data , ddof = 0)

Calculer la variance sans biais

Variance impartiale qui sous-estime la valeur de la variance

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Somme à la moyenne_value / N
avg = sp.mean(fish_data)

#Compter le nombre d'échantillons N
N = len(fish_data)

#«Distribution impartiale» en anglais
unb_dist = sp.sum((fish_data - avg)**2) / (N-1)


Calculer la variance sans biais (2)

Vous pouvez facilement calculer la variance non biaisée à l'aide de scipy.

import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

unb_dist = sp.var(fish_data , ddof = 1)

Calculer l'écart type

"Combien de déviations a M. XX?" Il s'agit de la valeur de déviation de "Eh bien, la valeur de déviation est faible !!?"

Elle peut être calculée en mettant au carré la variance sans biais.


import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Somme à la moyenne_value / N
avg = sp.mean(fish_data)

#Compter le nombre d'échantillons N
N = len(fish_data)

#«Distribution impartiale» en anglais
unb_dist = sp.sum((fish_data - avg)**2) / (N-1)

#Écart type «écart type» en anglais
std_dev = sp.sqrt(unb_dist)

Calculez l'écart type (2)

Vous pouvez facilement calculer l'écart type à l'aide de scipy.


import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])

#Calculer l'écart type en utilisant la variance sans biais(ddof = 1)
sp.std(fish_data,ddof = 1)



valeur minimum

Vous pouvez facilement calculer la valeur minimale à l'aide de scipy. Le plus petit nombre


import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])
sp.amin(fish_data)



Médian

Vous pouvez facilement calculer la valeur médiane à l'aide de scipy. La valeur médiane est le nombre situé exactement au milieu de l'échantillon.


import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])
sp.median(fish_data)



Valeur maximum

Vous pouvez facilement calculer la valeur maximale à l'aide de scipy. Le plus grand nombre


import numpy as np
import scipy as sp

fish_data = np.array([2,3,3,4,4,4,4,5,5,6])
sp.amax(fish_data)


Résumé

Si vous pouvez gérer numpy et scipy Les statistiques souvent utilisées dans les statistiques descriptives peuvent être grossièrement calculées. Cependant, comprenons comment obtenir chaque statistique.


fin

Recommended Posts

[Statistiques] Un ingénieur ordinaire a commencé à étudier les statistiques-part2
[Statistiques] Un ingénieur ordinaire a commencé à étudier les statistiques
Programme d'étude des statistiques