Youtube Videokommentar ist ebenfalls verfügbar.
P-024: Suchen Sie für den Datenrahmen für Belegdetails (df_receipt) das neueste Verkaufsdatum (sales_ymd) für jede Kunden-ID (customer_id) und zeigen Sie 10 Artikel an.
Code
df_receipt.groupby('customer_id').sales_ymd.max().reset_index().head(10)
customer_id | sales_ymd | |
---|---|---|
0 | CS001113000004 | 20190308 |
1 | CS001114000005 | 20190731 |
2 | CS001115000010 | 20190405 |
3 | CS001205000004 | 20190625 |
4 | CS001205000006 | 20190224 |
5 | CS001211000025 | 20190322 |
6 | CS001212000027 | 20170127 |
7 | CS001212000031 | 20180906 |
8 | CS001212000046 | 20170811 |
9 | CS001212000070 | 20191018 |
** - Wird verwendet, wenn Sie Daten mit demselben Wert gemeinsam in Pandas 'DataFrame / Series verarbeiten und die Summe oder den Durchschnitt der Daten mit demselben Wert überprüfen möchten. -'Groupby 'wird verwendet, wenn Sie Daten mit demselben Wert oder derselben Zeichenfolge erfassen und eine gemeinsame Operation (gesamt oder durchschnittlich) für jeden Wert oder dieselbe Zeichenfolge ausführen möchten.
Code
df_receipt.groupby('customer_id').agg({'sales_ymd':'max'}).reset_index().head(10)
Recommended Posts