[PYTHON] Visualisieren Sie, indem Sie dem "Box-Bart-Diagramm" (Boxen / Schwarm / Violine) "einen Biss" hinzufügen.
Überblick
- Dies ist ein Memo von dem, was ich über die Datenvisualisierung von [kaggle's titanic] gedacht habe (https://www.kaggle.com/c/titanic).
- Ich möchte die Verteilung des "Passagieralters" für jeden "Hafen an Bord" visualisieren.
- In solchen Fällen werden häufig Box-Whisker verwendet (Boxplot bei Seegeborenen).
- Auf der anderen Seite können ** andere ** Visualisierungsmittel verwendet werden, um "einen Biss" hinzuzufügen, also habe ich sie zusammengefasst.
- Diesmal als Alternative zu boxplot von seaborn Ich möchte die folgenden Bereiche betrachten.
- boxenplot
- swarmplot
- violinplot
- Ich hoffe, es hilft jemandem, aber es ist nur eine Arbeitsnotiz und eine persönliche Meinung.
Motivation
Box Whisker
- Bei der Titanic sieht das Alter der Passagiere in jedem Einschiffungshafen so aus. (Zuerst Kastenbart)
- Zur Zeit kann Folgendes gelesen werden.
- Das Durchschnittsalter liegt zwischen 25 und 30 Jahren, unabhängig davon, von welchem Hafen aus Sie an Bord gehen.
- Es gibt keinen großen Unterschied zwischen dem Medianwert und den Werten der ersten und dritten Division. (Queenstown ist etwas jünger?)
- Ausreißer (Daten für ältere Menschen) sind für Passagiere aus Southampton erkennbar 183826 / 6c03f3ea-bd76-a621-d64d-ecd52849062e.png)
Wenn Sie Swarmplot versuchen
- Wenn Sie versuchen, dies zu einem Schwarmplot zu machen, ist der Quadrantenwert schwer zu erkennen, aber es ist schön, "einen Biss" hinzuzufügen.
- Sie können die ** Anzahl der Daten für jede Serie kennen. (Eigentlich ist ** Queenstown eine kleine Zahl **)
- Leicht zu lesen, auch für diejenigen, die ** die Bedeutung von Boxen und Whiskern nicht kennen **
- Leicht zu lesende ** dichte und spärliche Teile ** von Daten![Download.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/183826/ a56c0cee-8ac2-8617-c574-9d5d3b07f237.png)
Fügen Sie dem Kastenbart "einen Bissen" hinzu
Versuchen Sie, Funktionen und Optionen zu ändern
Wenn Sie usw. tun, können Sie "einen Bissen" hinzufügen
Zusammenfassend (Cheet Sheet)
- boxenplot hat keine Split-Option **
- Beachten Sie, dass die Bedeutung von ** Split Option ** zwischen Swarmplot und Violinplot leicht unterschiedlich ist.
Möglichkeit |
boxenplot |
swarmplot |
violinplot |
Unbestimmt |
|
|
|
hue="Sex" |
|
|
|
hue="Sex" split=True |
Keiner |
|
|
"Welches" sollte "wann" verwendet werden?
- Es ist schwer zu sagen "das ist für diesen Zweck!", Aber ...
- Wenn Sie jedes vergleichen, können Sie die Eigenschaften sehen.
Boxplot gegen Boxenplot
- Es gibt keinen Unterschied, da nur 2 Buchstaben (en) alphabetisch geändert werden.
Möchten Sie es im ** ** Quadranten ** oder im ** feineren Quadranten ** anzeigen? Möchten Sie ** Ausreißer ** kennen? Ist der Punkt
|
Box Whisker(boxplot) |
boxenplot |
Anzeige |
|
|
Charakteristisch |
Quartal, Maximum Minimum Sie können auch die Situation von Ausreißern sehen |
AlsFeiner TeilungswertKann gesehen werden Als Ausreißer schwer zu sehen |
Boxplot gegen Schwarmplot
- Im Vergleich zu Box Whiskern ein Schwarmplot, der einzelne Daten kennt und diese erfasst ** kontinuierlich **
- Sie können die ** Anzahl, Dichte und Differenz ** der Daten sehen, aber die Plotkosten ** sind hoch ** und es ist schwierig für eine große Datenmenge.
|
Box Whisker(boxplot) |
swarmplot |
Anzeige |
|
|
Charakteristisch |
Sektion(Partitionswert)Zu fangen als HandlungKostengünstig |
Bewusstsein des EinzelnenUnd erfassen Sie kontinuierlich die Daten DatenUnterschiede nach Anzahl und SerieAuch verständlich しかし、HandlungHohe Kosten |
swarmplot vs violinplot
- Wie bei Swarmplot verarbeitet Violinplot ** kontinuierlich ** Daten und Plots ** weniger **
- Stattdessen bleiben die Anzahl der Daten und der Unterschied zwischen den Serien ** unbemerkt. ** **.
|
swarmplot |
violinplot |
Anzeige |
|
|
Charakteristisch |
Bewusstsein des EinzelnenUnd erfassen Sie kontinuierlich die Daten DatenUnterschiede nach Anzahl und SerieAuch verständlich Aber HandlungHohe Kosten |
Bewusstsein des Einzelnenせず、DatenのIch kann die Nummer nicht sehenAber, Kontinuierliches Verständnis der allgemeinen Trends HandlungKosten niedrig haltenKann Dinge tun. |
Zusammenfassung
- Es gibt Vor- und Nachteile, und es sollte je nach Anwendung ausgewählt werden. Zusammenfassend ist es jedoch wie folgt?
Abschnitt vs kontinuierlich |
Wie man "Hitomi" hinzufügt |
Welche Visualisierungsmethode soll ich wählen? |
Daten**Sektion (Teilung)**Behandelt mit |
AusreißerWenn Sie sich dessen bewusst sein möchten |
Box Whisker(boxplot) |
|
Aus dem QuadrantenDetailliertIn der Anzeige |
boxenplot |
DatenStändigGriff, |
DasAnzahl und DichteWenn du zeigen willst |
swarmplot |
|
Halten Sie die Grundstückskosten niedrig GesamttrendWenn du zeigen willst |
violinplot |