[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 027 Erläuterung
Youtube
Videokommentar ist ebenfalls verfügbar.
Problem
P-027: Berechnen Sie den durchschnittlichen Verkaufsbetrag (Betrag) für jeden Geschäftscode (store_cd) für den Datenrahmen für Belegdetails (df_receipt) und zeigen Sie den TOP5 in absteigender Reihenfolge an.
Antworten
Code
df_receipt.groupby('store_cd').amount.mean().reset_index().sort_values('amount', ascending=False).head(5)
Ausgabe
|
store_cd |
amount |
28 |
S13052 |
402.867470 |
12 |
S13015 |
351.111960 |
7 |
S13003 |
350.915519 |
30 |
S14010 |
348.791262 |
5 |
S13001 |
348.470386 |
Kommentar
- Verwenden Sie Pandas DataFrame / Series.
- Verwenden Sie diese Option, wenn Sie Daten mit demselben Wert zusammen verarbeiten und die Summe oder den Durchschnitt der Daten mit demselben Wert überprüfen möchten.
- ** 'Groupby' wird verwendet, wenn Sie Daten mit demselben Wert oder derselben Zeichenfolge erfassen und allgemeine Operationen (Summe, Durchschnitt usw.) für jeden Wert oder dieselbe Zeichenfolge ausführen möchten. ** ** **
- ** '. Amount.mean ()' zeigt den Durchschnittswert des Betrags an. ** ** **
- ** '. Reset_index ()' wird verwendet, wenn Sie die durch 'groupby' getrennten Indexnummern Seriennummern ab 0 neu zuweisen möchten. ** **.
- ** '. Sort_values (' Betrag ', aufsteigend = Falsch)' zeigt 'Betrag' in absteigender Reihenfolge an. ** **.
- Das gleiche Ergebnis wird mit diesem Code ausgegeben.
Code
df_receipt.groupby('store_cd').agg({'amount':'mean'}).reset_index().sort_values('amount', ascending=False).head(5)