[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 028 Erläuterung
Youtube
Videokommentar ist ebenfalls verfügbar.
Problem
P-028: Berechnen Sie den Medianwert des Verkaufsbetrags (Betrag) für jeden Geschäftscode (store_cd) für den Datenrahmen für Belegdetails (df_receipt) und zeigen Sie den TOP5 in absteigender Reihenfolge an.
Antworten
Code
df_receipt.groupby('store_cd').amount.median().reset_index().sort_values('amount', ascending=False).head(5)
Ausgabe
|
store_cd |
amount |
28 |
S13052 |
190 |
30 |
S14010 |
188 |
51 |
S14050 |
185 |
44 |
S14040 |
180 |
7 |
S13003 |
180 |
Kommentar
-Pandas DataFrame / Serie.
- Verwenden Sie diese Option, wenn Sie Daten mit demselben Wert zusammen verarbeiten und die Summe oder den Durchschnitt der Daten mit demselben Wert überprüfen möchten.
- ** 'Groupby' wird verwendet, wenn Sie Daten mit demselben Wert oder derselben Zeichenfolge erfassen und allgemeine Operationen (Summe, Durchschnitt usw.) für jeden Wert oder dieselbe Zeichenfolge ausführen möchten. ** ** **
- ** '. Amount.median ()' zeigt den Medianwert des Betrags an. ** ** **
- ** '. Reset_index ()' wird verwendet, wenn Sie die durch 'groupby' getrennten Indexnummern Seriennummern ab 0 neu zuweisen möchten. ** ** **
- ** '. Sort_values (' Betrag ', aufsteigend = Falsch)' zeigt 'Betrag' in absteigender Reihenfolge an. ** ** **
- Das gleiche Ergebnis wird mit diesem Code ausgegeben.
Code
df_receipt.groupby('store_cd').agg({'amount':'median'}).reset_index().sort_values('amount', ascending=False).head(5)