[PYTHON] Résumé de la méthode d'essai

test t

Quand univarié

Découvrez si la moyenne de l'échantillon est significativement différente d'une certaine valeur.

Lorsque bivarié

Découvrez s'il existe une différence significative entre les deux moyennes de l'échantillon. Cependant, la méthode est légèrement différente selon qu'il existe ou non une correspondance entre les deux variables. Voir le lien ci-dessous pour plus de détails Fonctions du module Statistiques

Analyse de la variance

Testez s'il y a une différence de moyenne entre trois niveaux ou plus. Après avoir trouvé le rapport F, calculez la valeur p à partir de celui-ci. En supposant que la distribution de la population est une distribution normale uniformément distribuée, la distribution de l'échantillon (distribution F) du rapport F est déjà claire, de sorte que la valeur p peut être obtenue en utilisant la distribution cumulative de la distribution F.

Rapport F

Lorsque le rapport F est grand, on estime que l'effet de l'effet est plus grand que l'erreur.

Rapport F=\frac{L'ampleur de la dispersion de l'effet}{L'ampleur de la dispersion d'erreur}

L'ampleur de l'effet est la distance entre les parcelles de violon. Appelé variation intergroupe. L'ampleur de l'erreur est la magnitude du tracé du violon. Appelé fluctuation intra-pays.

Test du carré square

Testez l'indépendance des données pour la table fractionnée.

  1. Trouvez la différence entre la fréquence observée et la fréquence attendue. Ici, toutes les fréquences attendues doivent être de 5 ou plus. Voici la statistique χ carré montrant la différence entre la fréquence attendue et la fréquence observée.
\chi^2=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}

Dans la formule ci-dessus, la table fractionnée avec uniquement la partie données est de m lignes et n colonnes. O est la fréquence observée et E est la fréquence attendue.

  1. Trouvez la valeur p.
    Puisqu'il a été prouvé que la distribution de l'échantillon de la statistique χ-carré suit de près la distribution χ-carré avec un degré de liberté, la valeur p peut être obtenue en utilisant la fonction de distribution cumulative de la distribution χ-carré.

Page de référence

https://qiita.com/kanamae879123/items/ec1226fc6d0ba789ae65 https://qiita.com/kanamae879123/items/2502258737a7d8e181c6

Recommended Posts

Résumé de la méthode d'essai
Clustering de méthodes de clustering
Résumé de la méthode de spécification des paramètres de distribution gamma
Résumé de la méthode de connexion par DB de SQL Alchemy
Parallélisation de la méthode de classe
Résumé de Tensorflow / Keras
Résumé de l'utilisation de pyenv
Résumé des opérations sur les chaînes
Résumé des arguments Python
[Mémo] Résumé du code de test
[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
Résumé de la méthode du noyau de Kaggle [Image]
résumé lié à l'opération de fichier python
Résumé des opérations de liste Python3
2017.3.6 ~ 3.12 Résumé de ce que nous avons fait
Résumé d'utilisation pratique de Flask
Résumé des types de distribution Linux
Résumé de la méthode d'implémentation Unity IAP
Résumé de l'utilisation de base de Pandas
Comportement de la méthode pandas rolling ()
Un bref résumé de Linux
Résumé des paramètres de connexion proxy
[Linux] [C / C ++] Résumé de la méthode d'acquisition des traces
Tester la version du module argparse
Résumé de l'utilisation de pandas.DataFrame.loc
Résumé de l'implémentation de base par PyTorch
Résumé de la relation de grattage (sélénium, pyautogui)
Un bref résumé de la collection Python
H29.2.27 ~ 3.5 Résumé de ce que j'ai fait
Tester l'adéquation de la distribution
tester
Résumé de l'utilisation de pyenv-virtualenv
Implémentation Einsum de la méthode d'itération de valeur
Apprentissage automatique ③ Résumé de l'arbre de décision
Introduction d'une méthode de conception de contrôleur pilotée par les données
Un résumé approximatif de l'histoire du système d'exploitation
J'ai brièvement résumé les bits quantiques (débutants)
Résumé du comportement de conversion de go json
Inspection PCR efficace par méthode de pool
[Test Driven Development (TDD)] Chapitre 21 Résumé
Introduction à la détection des anomalies et résumé des méthodes
[Anaconda3] Résumé des commandes fréquemment utilisées
[python] -1 signification de la méthode de remodelage de numpy
Résumé de l'utilisation de csvkit
[Pour les professionnels de la concurrence] Résumé du doublement
Résumé des avantages (inconvénients) lors du passage de CUnit à Google Test
Résumé des index et des tranches Python
[Recommandation] Résumé des avantages et des inconvénients de la méthode de filtrage / mise en œuvre basée sur le contenu et coopérative
Résumé du traitement multi-processus du langage de script
[OpenCV; Python] Résumé de la fonction findcontours
Mise en œuvre et expérience de la méthode de clustering convexe
[Python] Résumé de l'utilisation des pandas
2014/02/28 Résumé du contenu démo à #ssmjp, partie 1
Résumé de la procédure d'installation d'Oracle Database XE
Résumé des commandes fréquemment utilisées de django (débutant)