[PYTHON] Bestimmen Sie die Anzahl der Klassen mithilfe der Starges-Formel

Sturges 'Regel

Eine Formel, die einen Hinweis auf die Häufigkeitsverteilung und die Anzahl der Klassen beim Erstellen eines Histogramms gibt. Sie kann nach der folgenden Formel berechnet werden, wobei n die Anzahl der Stichproben und k die Anzahl der Klassen ist.

k = 1 + log_2N

Beispiel

Unter der Annahme, dass Daten mit 40 Stichproben (N = 40) vorliegen, wird daraus die Anzahl der Klassen beim Erstellen eines Histogramms berechnet.

1 + log_240 = 6.3219280948874 ≒ 6

Daraus wird die Anzahl der Klassen 6 festgelegt.

Hinweis

Die Anzahl der Klassen, die mit der Starges-Formel erhalten wurden, ist nur eine ** Richtlinie **. (Es gibt keine absolute Antwort zum Festlegen der Klassennummer beim Erstellen einer Häufigkeitsverteilungstabelle / eines Histogramms.)

Methodisierung in Python

sturges.py


import math

def sturges_rule(n):
    u"""
Star Jess Official
    """
    return round(1 + math.log2(n))

Überprüfen Sie im "Beispiel" oben.

>>> from sturges import sturges_rule
>>> sturges_rule(40)
6

Referenz

Recommended Posts

Bestimmen Sie die Anzahl der Klassen mithilfe der Starges-Formel
10. Zählen der Anzahl der Zeilen
Holen Sie sich die Anzahl der Ziffern
Berechnen Sie die Anzahl der Änderungen
Holen Sie sich die Anzahl der Ansichten von Qiita
Berechnung der Anzahl der Assoziationen von Klamer
Holen Sie sich die Anzahl der Youtube-Abonnenten
Zählen / überprüfen Sie die Anzahl der Methodenaufrufe.
So ermitteln Sie die Anzahl der CPUs ohne den Befehl sar
Winkelkorrektur (Projektionskonvertierung) der Lizenz mit OpenCV - Binarisierungsschwelle automatisch ermitteln-
Überprüfen Sie die Richtigkeit der Bewertungsformel "RC" anhand der tatsächlichen professionellen Baseballdaten
Stellen Sie die Änderung der Anzahl der Keyword-Auftritte pro Monat mithilfe von Pandas grafisch dar
Zählen Sie die Anzahl der Zeichen mit Echo
[Python] Summiert automatisch die Gesamtzahl der von Qiita mithilfe der API veröffentlichten Artikel
Eine Einführung in die Datenanalyse mit Python - Um die Anzahl der Videoansichten zu erhöhen -
Richten Sie die Anzahl der Stichproben zwischen Datenklassen für maschinelles Lernen mit Python aus
Geben Sie die Anzahl der CPU-Kerne in Python aus
Abschätzung der Wirkung von Maßnahmen anhand von Neigungswerten
Überprüfen Sie den Typ der von Ihnen verwendeten Variablen
Organisieren Sie die Bedeutung von Methoden, Klassen und Objekten
Berechnen Sie die Gesamtzahl der Kombinationen mit Python
Teilen Sie die Zeichenfolge in die angegebene Anzahl von Zeichen
Finden Sie die Anzahl der Tage in einem Monat
Minimieren Sie die Anzahl der Polierungen, indem Sie die Kombination optimieren
Ich habe versucht, den Bildfilter von OpenCV zu verwenden
Überprüfen Sie den Status der Daten mit pandas_profiling
[Python] Bestimmen Sie den Typ der Iris mit SVM
Scraping der Gewinndaten von Zahlen mit Docker
[SIR-Modellanalyse] Transformieren Sie die Formel, um γ und die effektive Reproduktionszahl R ♬ zu bestimmen
Berechnung der kürzesten Route nach der Monte-Carlo-Methode
Wie man die Portnummer des xinetd-Dienstes kennt
[Python] Ein Programm, das die Anzahl der Täler zählt
Erläuterung des Konzepts der Regressionsanalyse mit Python Teil 2
Projecet Euler 12 Ermitteln Sie die Anzahl der Brüche ohne Division.
So ermitteln Sie die Anzahl der Stellen in Python
Ermitteln und verarbeiten Sie die Codierung der Textdatei automatisch
Beziehung der Fibonacci-Zahlenreihe und des Goldenen Schnitts
Schneiden Sie einen Teil der Zeichenfolge mit einem Python-Slice aus
Zählen Sie die Anzahl der Parameter im Deep-Learning-Modell
Berechnung der minimal erforderlichen Stimmenzahl aus der Stimmenzahl
Bestimmen Sie den Schwellenwert mithilfe der P-Tile-Methode in Python
Versuchen Sie, die Anzahl der Likes auf Twitter zu schätzen
Zeichnen auf Jupyter mit der Plot-Funktion von Pandas
Der Schmerz von gRPC mit Python. November 2019. (Persönliches Memo)
Sagen Sie die Anzahl der mit COVID-19 infizierten Personen mit Prophet voraus
Erläuterung des Konzepts der Regressionsanalyse mit Python Teil 1
Ich habe versucht, die API von Sakenowa Data Project zu verwenden
Verwalten Sie die Paketversionsnummer von require.txt mit pip-tools
Lassen Sie uns die Emotionen von Tweet mit Chainer (2.) analysieren.
Studie aus Python Hour8: Verwenden von Paketen
[Python] Ermittelt die Anzahl der Aufrufe aller veröffentlichten Artikel
Lassen Sie uns die Emotionen von Tweet mit Chainer (1.) analysieren.
Die Geschichte der Verwendung von Circleci zum Bau vieler Linux-Räder
Visualisieren Sie die Anzahl der Beschwerden von Lebensversicherungsunternehmen
Clustering G-bedeutet, dass die Anzahl der Cluster automatisch bestimmt wird
VisibleDeprecationWarning: Die Verwendung einer Nicht-Ganzzahl anstelle einer Ganzzahl führt in Zukunft zu einem Fehler