Grundlegende Zusammenfassung der Datenoperationen in Python Pandas - Zweite Hälfte: Datenaggregation

Einführung

So bearbeiten Sie Daten in Pandas, was für die Datenanalyse in Python unverzichtbar ist Ich habe die Grundlagen zusammengefasst.

Aus wichtigen Grammatiken, die Sie einfach vergessen haben, haben wir einige Tipps beigefügt.

Empfohlen für solche Leute → Ich möchte Pandas zum ersten Mal berühren! → Versuchen Sie, R auch in Python zu verwenden. → Ich kann mich nicht an die Grammatik von Pandas erinnern - es wäre praktisch, wenn es irgendwo eine Liste gäbe ... → Wie viel Datenverarbeitung kann mit Python überhaupt durchgeführt werden?

Wenn Sie mehr über Datenmanipulation erfahren möchten, beginnen Sie bitte mit der ersten Hälfte.

◆ Grundlegende Zusammenfassung der Datenoperationen mit Python Pandas - Erste Hälfte: Datenerstellung und -operationen http://qiita.com/hik0107/items/d991cc44c2d1778bb82e

Lassen Sie uns die Berechnung durchführen

◆ Statistikberechnung

Suchen Sie Statistiken für jede Zeile oder Spalte eines Datenrahmens

math.py


 
#Spaltenrichtung insgesamt
df_sample["score1"].sum(axis=0) #Berechnen Sie die Summe der Score1-Werte
        #axis=0 bedeutet in vertikaler Richtung summieren. Da es standardmäßig 0 ist, kann es weggelassen werden.
 
df_sample[["score1","score2"]].sum(axis=0)  #score1,Summiere jede Punktzahl2. Es werden zwei Ergebnisse ausgegeben
 
 
#Zeilenrichtung insgesamt
df_sample[["score1","score2"]].sum(axis=1)  
        #Summieren Sie die Werte für score1 und score2 in jeder Zeile. Die Ergebnisse werden für jede Anzahl von Spalten ausgegeben
        #axis=1 bedeutet in horizontaler Richtung summieren. In Pandas ist die Achse in der Zeilenrichtung. "
Denken Sie daran, dass Sie häufig zwischen Spaltenrichtungen unterscheiden.

◆Pivoting Pivot-tabellenartige Kreuztabelle und Datenstrukturkonvertierung

pivot.py


 
df_sample.pivot_table("score1",     #Geben Sie die zu aggregierenden Variablen an
                       aggfunc="sum",  #Festlegen, wie aggregiert werden soll
                       fill_value=0,   #Angeben des Füllwerts, wenn kein entsprechender Wert vorhanden ist
                       rows="class",     #Angeben von Variablen, die in Zeilenrichtung belassen werden sollen
                       columns="day_no")   #Angeben von Variablen, die in Spaltenrichtung erweitert werden sollen

◆ Group_by-Operation

groupby.py


#In Pandas werden der Vorgang von Groupby und die zugehörige Aggregation separat ausgeführt.
#Wenn Sie die groupby-Methode verwenden, sieht sie wie ein normaler Datenrahmen aus, jedoch wie Group_Ein Objekt mit den Schlüsselinformationen By wird generiert.
#Dies gilt auch für R. Gruppe von in Dplyr()Ein Schlüssel wird von festgelegt und Aggregate entsprechend dem Schlüssel zusammenfassen.
 
df_sample_grouped = df_sample.groupby("day_no")  # day_Gruppe mit Nr_Mach mit.
df_sample_grouped[["score1","score2"]].sum()          
  #Summe für gruppierte Objekte.
  #Falls gewünscht, können Sie eine Variable angeben, um die Summe auszuführen.
 
# Group_By Key wird zwangsweise als Index behandelt
#Daher Gruppe_Kann nicht wie zuvor von als Spaltenvariable behandelt werden

df_sample_grouped = df_sample.groupby("day_no", as_index=false)
   #   as_index=Wenn false angegeben wird, wird es nicht mehr als Index behandelt.

Lesen und schreiben wir Daten

◆ Datenimport und -export

Erstellen Sie eine DF aus einer CSV-Datei oder exportieren Sie eine DF in eine CSV-Datei

file.py


 
#CSV-Daten importieren
pd.read_csv("path_of_data")
 
#CSV-Daten exportieren
 
pd.to_csv("path_of_exported_file")

Recommended Posts

Grundlegende Zusammenfassung der Datenoperationen in Python Pandas - Zweite Hälfte: Datenaggregation
Grundlegende Zusammenfassung der Datenoperationen mit Python Pandas - Erste Hälfte: Datenerstellung und -operationen
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
Bildpixel-Manipulation in Python
Zusammenfassung verschiedener for-Anweisungen in Python
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Zusammenfassung zum Importieren von Dateien in Python 3
Echtzeitvisualisierung von Thermografie AMG8833-Daten in Python
Zusammenfassung der Verwendung von MNIST mit Python
Die Geschichte des Lesens von HSPICE-Daten in Python
Aufgezeichnete Umgebung für die Datenanalyse mit Python
Grundlegende Geschichte der Vererbung in Python (für Anfänger)
Zusammenfassung der Excel-Operationen mit OpenPyXL in Python
Datenanalyse in Python Zusammenfassung der Quellen, die Anfänger zuerst betrachten sollten
Grundlegende Datenrahmenoperationen, die von Anfängern in einer Woche Python-Lernen geschrieben wurden
Grundlegende Sortierung in Python
String-Manipulation in Python
Datumsmanipulation in Python
Grundkenntnisse in Python
Zusammenfassung der Python-Argumente
Verarbeitung von CSV-Daten in voller und halber Breite in Python
[Python] Manipulation von Elementen in der Liste (Array) [Hinzufügen / Löschen]
Zusammenfassung der beim Extrahieren von Daten verwendeten Pandas-Methoden [Python]
Den Inhalt der Daten in Python nicht kennen
Liste des Python-Codes, der bei der Big-Data-Analyse verwendet wird
Verwenden wir die offenen Daten von "Mamebus" in Python
Zusammenfassung des grundlegenden Ablaufs des maschinellen Lernens mit Python
Zusammenfassung der Datumsverarbeitung in Python (Datum / Uhrzeit und Datum)
Zusammenfassung der statistischen Datenanalysemethoden mit Python, die im Geschäftsleben verwendet werden können
Versuchen Sie, COVID-19 Tokyo-Daten mit Python zu kratzen
Behandeln Sie Umgebungsdaten in Python
Zusammenfassung der Python-Dateivorgänge
Zusammenfassung der Python3-Listenoperationen
Mit Python erlerntes Refactoring (Basic)
Was ist neu in Python 3.10 (Zusammenfassung)
Bearbeiten von Daten in Python-try mit Pandas_plyr
Zeigen Sie UTM-30LX-Daten in Python an
[Für Anfänger] Zusammenfassung der Standardeingabe in Python (mit Erklärung)
Objektäquivalenzbeurteilung in Python
[Homologie] Zählen Sie mit Python die Anzahl der Löcher in den Daten
Python-Datentyp-Zusammenfassungsnotiz
Ein Memo, dass ich eine Grundfunktion in Python mit Wiederholung geschrieben habe
Zusammenfassung der Gesichtserkennung in Python
Vergleich der Datenrahmenbehandlung in Python (Pandas), R, Pig
Zusammenfassung der grundlegenden Verwendung von Pandas
Datumsmanipulation von Strings in Python
Grundlegende Verwendung von Python-F-String
Implementierung der schnellen Sortierung in Python
Was ist neu in Python 3.9 (Zusammenfassung)
Zusammenfassung der grundlegenden Zeichenmethode von Plotly Express, dem De-facto-Standard der Python-Zeichenbibliothek in der Reiwa-Ära
Eine einfache Datenanalyse von Bitcoin, die von CoinMetrics in Python bereitgestellt wird
Eine kurze Zusammenfassung von Graphviz in Python (nur für Mac erklärt)
Basiskarteninformationen mithilfe der Python-Geotiff-Konvertierung numerischer Höhendaten
[Blender Python] Ordnen Sie benutzerdefinierte Eigenschaftsdaten in template_list () des UI-Layouts an
Holen Sie sich LeapMotion-Daten in Python.
Manipulation des Datei- / Ordnerpfads in Python
Lesen Sie die Protokollpufferdaten mit Python3
Zusammenfassung der Grundkenntnisse von PyPy Teil 1