Youtube Videokommentar ist ebenfalls verfügbar.
P-025: Suchen Sie für den Datenrahmen für Belegdetails (df_receipt) das älteste Verkaufsdatum (sales_ymd) für jede Kunden-ID (customer_id) und zeigen Sie 10 Artikel an.
Code
df_receipt.groupby('customer_id').sales_ymd.min().reset_index().head(10)
customer_id | sales_ymd | |
---|---|---|
0 | CS001113000004 | 20190308 |
1 | CS001114000005 | 20180503 |
2 | CS001115000010 | 20171228 |
3 | CS001205000004 | 20170914 |
4 | CS001205000006 | 20180207 |
5 | CS001211000025 | 20190322 |
6 | CS001212000027 | 20170127 |
7 | CS001212000031 | 20180906 |
8 | CS001212000046 | 20170811 |
9 | CS001212000070 | 20191018 |
** - Wird verwendet, wenn Sie Daten mit demselben Wert gemeinsam in Pandas 'DataFrame / Series verarbeiten und die Summe oder den Durchschnitt der Daten mit demselben Wert überprüfen möchten. -'Groupby 'wird verwendet, wenn Sie Daten mit demselben Wert oder derselben Zeichenfolge erfassen und allgemeine Operationen (Summe, Durchschnitt usw.) für denselben Wert oder dieselbe Zeichenfolge ausführen möchten.
Code
df_receipt.groupby('customer_id').agg({'sales_ymd':'min'}).reset_index().head(10)
Recommended Posts