Youtube Videokommentar ist ebenfalls verfügbar.
P-025: Suchen Sie für den Datenrahmen für Belegdetails (df_receipt) das älteste Verkaufsdatum (sales_ymd) für jede Kunden-ID (customer_id) und zeigen Sie 10 Artikel an.
Code
df_receipt.groupby('customer_id').sales_ymd.min().reset_index().head(10)
| customer_id | sales_ymd | |
|---|---|---|
| 0 | CS001113000004 | 20190308 | 
| 1 | CS001114000005 | 20180503 | 
| 2 | CS001115000010 | 20171228 | 
| 3 | CS001205000004 | 20170914 | 
| 4 | CS001205000006 | 20180207 | 
| 5 | CS001211000025 | 20190322 | 
| 6 | CS001212000027 | 20170127 | 
| 7 | CS001212000031 | 20180906 | 
| 8 | CS001212000046 | 20170811 | 
| 9 | CS001212000070 | 20191018 | 
** - Wird verwendet, wenn Sie Daten mit demselben Wert gemeinsam in Pandas 'DataFrame / Series verarbeiten und die Summe oder den Durchschnitt der Daten mit demselben Wert überprüfen möchten. -'Groupby 'wird verwendet, wenn Sie Daten mit demselben Wert oder derselben Zeichenfolge erfassen und allgemeine Operationen (Summe, Durchschnitt usw.) für denselben Wert oder dieselbe Zeichenfolge ausführen möchten.
Code
df_receipt.groupby('customer_id').agg({'sales_ymd':'min'}).reset_index().head(10)
        Recommended Posts