Le gouvernement métropolitain de Tokyo a publié des données sur les personnes infectées par le COVID-19. Poursuivant depuis la dernière fois, je souhaite traiter ces données CSV.
Données sur les personnes infectées publiées par le gouvernement métropolitain de Tokyo https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068/resource/c2d997db-1450-43fa-8037-ebb11ec28d4c (Fichier CSV) https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
Les données publiées par le gouvernement métropolitain de Tokyo incluent l'âge, le sexe et la date de publication de chaque personne testée positive pour le nouveau virus corona. Je veux obtenir le nombre de cas pour chaque date de publication, mais pour cela, il est nécessaire d'effectuer des traitements tels que GROUP BY et COUNT en SQL. Le nombre de cas par jour a été obtenu par le programme suivant.
python
import pandas as pd
data = pd.read_csv('130001_tokyo_covid19_patients.csv',header=0) #header=0 Utilisez la première ligne comme en-tête
#Colonne pour extraire groupby en sql, fonction de comptage
li = data[['No','Publié_Date']].groupby('Publié_Date').agg(['count'])
print(li )
[Python] Lecture de fichiers csv à l'aide de pandas https://qiita.com/f_kazqi/items/0e8e948be44ef2003f71
Lire CSV avec / sans en-tête avec read_csv https://qiita.com/yuba/items/d09e387a1ec191eb2738
Sélectionnez et obtenez des lignes / colonnes avec la référence d'index pandas https://note.nkmk.me/python-pandas-index-row-column/
Comment utiliser la fonction de comptage pour compter le nombre de données dans Pandas https://deepage.net/features/pandas-count.html
Recommended Posts