[PYTHON] Visualisieren Sie, indem Sie dem "Box-Bart-Diagramm" (Boxen / Schwarm / Violine) "einen Biss" hinzufügen.
        
      
      
   
      
Überblick
- Dies ist ein Memo von dem, was ich über die Datenvisualisierung von [kaggle's titanic] gedacht habe (https://www.kaggle.com/c/titanic).
 
- Ich möchte die Verteilung des "Passagieralters" für jeden "Hafen an Bord" visualisieren.
 
- In solchen Fällen werden häufig Box-Whisker verwendet (Boxplot bei Seegeborenen).
 
- Auf der anderen Seite können ** andere ** Visualisierungsmittel verwendet werden, um "einen Biss" hinzuzufügen, also habe ich sie zusammengefasst.
 
- Diesmal als Alternative zu boxplot von seaborn Ich möchte die folgenden Bereiche betrachten.
 
- boxenplot
 
- swarmplot
 
- violinplot
 
- Ich hoffe, es hilft jemandem, aber es ist nur eine Arbeitsnotiz und eine persönliche Meinung.
 
Motivation
Box Whisker
- Bei der Titanic sieht das Alter der Passagiere in jedem Einschiffungshafen so aus. (Zuerst Kastenbart)
 
- Zur Zeit kann Folgendes gelesen werden.
 
- Das Durchschnittsalter liegt zwischen 25 und 30 Jahren, unabhängig davon, von welchem Hafen aus Sie an Bord gehen.
 
- Es gibt keinen großen Unterschied zwischen dem Medianwert und den Werten der ersten und dritten Division. (Queenstown ist etwas jünger?)
 
- Ausreißer (Daten für ältere Menschen) sind für Passagiere aus Southampton erkennbar
 183826 / 6c03f3ea-bd76-a621-d64d-ecd52849062e.png) 
Wenn Sie Swarmplot versuchen
- Wenn Sie versuchen, dies zu einem Schwarmplot zu machen, ist der Quadrantenwert schwer zu erkennen, aber es ist schön, "einen Biss" hinzuzufügen.
 
- Sie können die ** Anzahl der Daten für jede Serie kennen. (Eigentlich ist ** Queenstown eine kleine Zahl **)
 
- Leicht zu lesen, auch für diejenigen, die ** die Bedeutung von Boxen und Whiskern nicht kennen **
 
- Leicht zu lesende ** dichte und spärliche Teile ** von Daten
 
Fügen Sie dem Kastenbart "einen Bissen" hinzu
Versuchen Sie, Funktionen und Optionen zu ändern
Wenn Sie usw. tun, können Sie "einen Bissen" hinzufügen
Zusammenfassend (Cheet Sheet)
- boxenplot hat keine Split-Option **
 
- Beachten Sie, dass die Bedeutung von ** Split Option ** zwischen Swarmplot und Violinplot leicht unterschiedlich ist.
 
| Möglichkeit | 
boxenplot | 
swarmplot | 
violinplot | 
| Unbestimmt | 
  | 
  | 
  | 
| hue="Sex" | 
  | 
  | 
  | 
hue="Sex"   split=True | 
Keiner | 
  | 
  | 
"Welches" sollte "wann" verwendet werden?
- Es ist schwer zu sagen "das ist für diesen Zweck!", Aber ...
 
- Wenn Sie jedes vergleichen, können Sie die Eigenschaften sehen.
 
Boxplot gegen Boxenplot
- Es gibt keinen Unterschied, da nur 2 Buchstaben (en) alphabetisch geändert werden.
Möchten Sie es im ** ** Quadranten ** oder im ** feineren Quadranten ** anzeigen? Möchten Sie ** Ausreißer ** kennen? Ist der Punkt
 
 | 
Box Whisker(boxplot) | 
boxenplot | 
| Anzeige | 
  | 
  | 
| Charakteristisch | 
Quartal, Maximum Minimum Sie können auch die Situation von Ausreißern sehen | 
AlsFeiner TeilungswertKann gesehen werden Als Ausreißer schwer zu sehen | 
Boxplot gegen Schwarmplot
- Im Vergleich zu Box Whiskern ein Schwarmplot, der einzelne Daten kennt und diese erfasst ** kontinuierlich **
 
- Sie können die ** Anzahl, Dichte und Differenz ** der Daten sehen, aber die Plotkosten ** sind hoch ** und es ist schwierig für eine große Datenmenge.
 
 | 
Box Whisker(boxplot) | 
swarmplot | 
| Anzeige | 
  | 
  | 
| Charakteristisch | 
Sektion(Partitionswert)Zu fangen als HandlungKostengünstig | 
Bewusstsein des EinzelnenUnd erfassen Sie kontinuierlich die Daten DatenUnterschiede nach Anzahl und SerieAuch verständlich しかし、HandlungHohe Kosten | 
swarmplot vs violinplot
- Wie bei Swarmplot verarbeitet Violinplot ** kontinuierlich ** Daten und Plots ** weniger **
 
- Stattdessen bleiben die Anzahl der Daten und der Unterschied zwischen den Serien ** unbemerkt. ** **.
 
 | 
swarmplot | 
violinplot | 
| Anzeige | 
  | 
  | 
| Charakteristisch | 
Bewusstsein des EinzelnenUnd erfassen Sie kontinuierlich die Daten DatenUnterschiede nach Anzahl und SerieAuch verständlich Aber HandlungHohe Kosten | 
Bewusstsein des Einzelnenせず、DatenのIch kann die Nummer nicht sehenAber, Kontinuierliches Verständnis der allgemeinen Trends HandlungKosten niedrig haltenKann Dinge tun. | 
Zusammenfassung
- Es gibt Vor- und Nachteile, und es sollte je nach Anwendung ausgewählt werden. Zusammenfassend ist es jedoch wie folgt?
 
| Abschnitt vs kontinuierlich | 
Wie man "Hitomi" hinzufügt | 
Welche Visualisierungsmethode soll ich wählen? | 
Daten**Sektion (Teilung)**Behandelt mit | 
AusreißerWenn Sie sich dessen bewusst sein möchten | 
Box Whisker(boxplot)  | 
 | 
Aus dem QuadrantenDetailliertIn der Anzeige | 
boxenplot  | 
| DatenStändigGriff, | 
DasAnzahl und DichteWenn du zeigen willst | 
swarmplot  | 
 | 
Halten Sie die Grundstückskosten niedrig GesamttrendWenn du zeigen willst | 
violinplot  |