[PYTHON] Analysieren Sie Daten im CSV-Format mit SQL

Sie können q verwenden, um SQL direkt an Dateien im CSV- oder TSV-Format auszugeben.

Installationsverfahren

Beispiel einer Datenanalyse mit q

Wenn Sie die folgende CSV von Auftragsdaten haben (Dateiname ist orders.csv).

OrderId,OrderDate,ProductID,UserID,Quantity,TotalPrice
10000005,2015/2/13,100,10000,1,10000
10000006,2015/2/13,101,10001,2,2000
10000007,2015/2/13,102,10002,3,6000
10000008,2015/2/13,100,10003,1,10000
10000009,2015/2/13,101,10004,2,2000
10000010,2015/2/14,100,10005,3,30000
10000011,2015/2/14,101,10006,1,2000
10000012,2015/2/14,102,10007,2,4000
10000013,2015/2/14,100,10008,3,30000
10000014,2015/2/14,101,10009,1,1000

Ich möchte Daten mit einem Umsatz (Gesamtpreis) von 10.000 Yen oder mehr extrahieren

$ q -H -d',' "SELECT * FROM ./orders.csv WHERE TotalPrice >= 10000"

10000005,2015/2/13,100,10000,1,10000
10000008,2015/2/13,100,10003,1,10000
10000010,2015/2/14,100,10005,3,30000
10000013,2015/2/14,100,10008,3,30000

-H bedeutet, die Kopfzeile zu überspringen. Geben Sie das Trennzeichen mit -d an (geben Sie "," an, da es sich um CSV handelt).

Ich möchte den täglichen Umsatz aggregieren

$ q -H -d',' "SELECT OrderDate, SUM(TotalPrice) FROM ./orders.csv GROUP BY OrderDate"

2015/2/13,30000
2015/2/14,67000

Ich möchte ein Produktverkaufsranking erstellen

q -H -d',' "SELECT ProductId, SUM(Quantity), SUM(TotalPrice) AS total FROM ./orders.csv GROUP BY ProductId Order BY total DESC"

100,8,80000
102,5,10000
101,6,7000

Die Datenanalyse ist schnell.

Recommended Posts

Analysieren Sie Daten im CSV-Format mit SQL
Versuchen Sie, mit django-import-export csv-Daten zu django hinzuzufügen
Konvertieren Sie Daten im JSON-Format in txt (mit yolo)
Datenanalyse mit xarray
Holen Sie sich Amazon RDS (PostgreSQL) -Daten mithilfe von SQL mit Pandas
Datenbereinigung 2 Datenbereinigung mit DataFrame
Datenbereinigung mit Python
Aggregieren Sie Ereignisdaten mithilfe von Pandas in einem einzeiligen Ein-Benutzer-Format
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
SQL-Format mit sqlparse
Extrahieren Sie Twitter-Daten mit CSV
Wählen Sie Features mit Textdaten aus
Schreiben Sie Daten im HDF-Format
Datenvisualisierungsmethode mit Matplotlib (1)
Datenvisualisierungsmethode mit Matplotlib (2)
SQL-Verbindungsmethode mit pyodbc
Datenanalyse mit Python-Pandas
CSV-Daten extrahieren und berechnen
Hachinais Notenverwaltung mit SQL
[Python] Lesen Sie eine CSV-Datei mit großen Datenmengen mithilfe eines Generators