1. Statistiques apprises avec Python 1-2. Calcul de diverses statistiques (Numpy)

Tout d'abord, jetons un coup d'œil à l'utilité de Pandas et Numpy.

Par conséquent, on peut dire que Pandas et Numpy sont souvent combinés étape par étape et utilisés dans la série de flux suivante, par exemple. 001_002_002.PNG

** ⑴ Préparez les données **

data = [12, 3, 5, 2, 6, 7, 9, 6, 4, 11]

J'ai créé une liste standard Python en écrivant les valeurs directement dans variable name = [], séparées par des virgules. Ci-dessous, nous allons calculer diverses statistiques à l'aide de Numpy.

** ⑵ Calculez la valeur moyenne **

np.mean(data)

001_002_001.PNG

La fonction «moyenne» de Numpy a calculé une moyenne de 6,5.

** ⑶ Calculez la médiane **

np.median(data)

001_002_003.PNG

La fonction «médiane» de Numpy a calculé une médiane de 6,0. Lorsque les données sont triées par ordre de taille, la valeur située exactement au centre est également appelée médiane. S'il est égal au deuxième quadrant et qu'il y a plusieurs données, ce sera la moyenne de deux valeurs proches du centre.

** ⑷ Calculez la valeur totale **

np.sum(data)

001_002_004.PNG

La fonction sum de Numpy a calculé une valeur totale de 65.

** ⑸ Calculer l'écart type **

np.std(data)

001_002_005.PNG

La fonction std de Numpy a donné le résultat 3.138470965295043. Cependant, il s'agit de la valeur de ** l'écart-type de la population **. Veuillez noter qu'il existe deux types d'écarts types, l'écart-type de la population et le ** écart-type non biaisé **.

** Population et spécimen </ font> **

L'ensemble du sujet de recherche ou de recherche est appelé la ** population **, et la partie extraite de la population est appelée ** échantillon **. Les enquêtes qui examinent l'ensemble de la population sont appelées ** enquêtes à 100% ** ou ** enquêtes tous azimuts **. Des exemples typiques sont l '«enquête nationale», à laquelle toutes les personnes résidant au Japon doivent répondre, et l' «enquête statistique sur les établissements / entreprises», que l'on peut appeler le recensement national des établissements commerciaux. Probablement. En d'autres termes, presque toutes les données traitées dans le monde réel peuvent être considérées comme des échantillons d'enquêtes par sondage. Cependant, je ne veux pas du tout connaître les caractéristiques et les tendances des spécimens, et j'essaie toujours d'estimer les caractéristiques et les tendances de la population en ciblant les spécimens. Maintenant, deux statistiques sont nécessaires pour calculer l'écart type. Tout d'abord, la valeur moyenne est calculée, la variance est calculée à l'aide de celle-ci et la racine carrée de la variance est considérée comme l'écart type. La moyenne, la variance et l'écart type calculés à partir de l'échantillon sont préfixés respectivement par "échantillon" ou "sans biais" et ** moyenne de l'échantillon $ \ bar {X} $ **, ** variance sans biais $ s ^ 2 Ils sont appelés $ ** et ** écart-type non biaisé $ s $ **. Par contre, la moyenne, la variance et l'écart type de la population estimés à partir de l'échantillon sont ** moyenne de la population $ μ $ **, ** variance de la population $ σ ^ 2 $ **, ** écart type de la population $ σ. Nous l'appelons $ ** pour le distinguer.

Par conséquent, lorsque vous utilisez Numpy pour calculer l'écart-type non biaisé, procédez comme suit.

np.std(data, ddof=1) 

001_002_006.PNG

Comparons-le avec l'écart type calculé à l'aide de Pandas plus tôt.

df = pd.DataFrame(data) #Convertir les données en trame de données Pandas
df.describe().loc['std']

001_002_007.PNG

L'écart type de Pandas est un écart type non biaisé.


Ensuite, calculons les statistiques de base à l'aide de statistiques, qui est une bibliothèque Python standard.

Recommended Posts

1. Statistiques apprises avec Python 1-2. Calcul de diverses statistiques (Numpy)
1. Statistiques apprises avec Python 1-3. Calcul de diverses statistiques (statistiques)
[Python] Méthode de calcul avec numpy
1. Statistiques apprises avec Python 1-1. Statistiques de base (Pandas)
1. Statistiques apprises avec Python 2. Distribution des probabilités [Compréhension approfondie de scipy.stats]
calcul de tableau numpy python
1. Statistiques apprises avec Python 2-1. Distribution de probabilité [variable discrète]
Divers traitements de Python
Calcul numérique avec Python
Apprenez lentement avec Python "Principe de l'inversion des dépendances"
Calcul de la quantité d'informations mutuelles (valeur continue) avec numpy
Dérivés appris en utilisant Python- (1) Calcul du taux de change à terme-
[Bases des statistiques mathématiques modernes avec python] Chapitre 1: Probabilité
Implémentation de SMO avec Python + NumPy
À propos de divers encodages de Python 3
Manipulez diverses bases de données avec Python
[Calcul scientifique / technique par Python] Fonctionnement de base du tableau, numpy
[Python] Programmation orientée objet apprise avec Pokemon
Expérience d'apprentissage Perceptron apprise avec Python
Structure de données Python apprise avec la chimioinfomatique
Jeu de vie avec Python! (Le jeu de la vie de Conway)
Ramassage efficace du réseau avec Python
10 fonctions du "langage avec batterie" python
Implémentation de la méthode Dyxtra par python
[Python] Calcul du coefficient kappa (k)
Coexistence de Python2 et 3 avec CircleCI (1.0)
Etude de base d'OpenCV avec Python
[Algorithme x Python] Calcul des statistiques de base Partie 2 (moyenne, médiane, la plus fréquente)
[Algorithm x Python] Calcul des statistiques de base (valeur totale, valeur maximale, valeur minimale)
[Bases des statistiques mathématiques modernes avec python] Chapitre 3: Distribution de probabilité typique
Bases du traitement d'images binarisées par Python
[Exemple d'amélioration de Python] Apprentissage de Python avec Codecademy
J'ai remplacé le calcul numérique de Python par Rust et comparé la vitesse
Branchement conditionnel de Python appris avec la chimioinfomatique
Vérifier l'existence du fichier avec python
Obstrué par la mise à jour Python de la console GCP ①
Introduction facile de la reconnaissance vocale avec Python
[Python] Calcul de la similarité d'image (coefficient de dés)
Code source pour la séparation des sources sonores (série de pratiques d'apprentissage automatique) appris avec Python
L'histoire du calcul numérique des équations différentielles avec TensorFlow 2.0
[Python] Divers traitements de données utilisant le tableau Numpy
UnicodeEncodeError lutte avec la sortie standard de python3
[Calcul scientifique / technique par Python] Calcul du produit de la matrice par l'opérateur @, python3.5 ou supérieur, numpy
Diverses spécifications de format de la méthode str.format () de Python3
Dessin avec Matrix-Reinventor of Python Image Processing-
Recommandation d'Altair! Visualisation des données avec Python
[Python] Diverses combinaisons de chaînes de caractères et de valeurs
Calcul en temps réel de la valeur moyenne avec corroutine