Die Regierung der Metropole Tokio hat Daten zu COVID-19-infizierten Personen veröffentlicht. Nach dem letzten Mal möchte ich diese CSV-Daten verarbeiten.
Von der Tokyo Metropolitan Government veröffentlichte Daten zu infizierten Personen https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068/resource/c2d997db-1450-43fa-8037-ebb11ec28d4c (CSV-Datei) https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
Die von der Stadtregierung von Tokio veröffentlichten Daten umfassen Alter, Geschlecht und Veröffentlichungsdatum jeder Person, die positiv auf das neue Koronavirus getestet wurde. Ich möchte die Anzahl der Fälle für jedes Veröffentlichungsdatum ermitteln, aber zu diesem Zweck ist es erforderlich, Verarbeitungen wie GROUP BY und COUNT in SQL durchzuführen. Die Anzahl der Fälle pro Tag wurde durch das folgende Programm ermittelt.
python
import pandas as pd
data = pd.read_csv('130001_tokyo_covid19_patients.csv',header=0) #header=0 Verwenden Sie die erste Zeile als Überschrift
#Spalte zum Extrahieren von groupby in SQL, Zählfunktion
li = data[['No','Veröffentlicht_Datum']].groupby('Veröffentlicht_Datum').agg(['count'])
print(li )
[Python] Lesen von CSV-Dateien mit Pandas https://qiita.com/f_kazqi/items/0e8e948be44ef2003f71
Lesen Sie CSV mit / ohne Header mit read_csv https://qiita.com/yuba/items/d09e387a1ec191eb2738
Wählen Sie Zeilen / Spalten mit Pandas-Indexreferenz aus und rufen Sie sie ab https://note.nkmk.me/python-pandas-index-row-column/
Verwendung der Zählfunktion zum Zählen der Anzahl der Daten in Pandas https://deepage.net/features/pandas-count.html
Recommended Posts