Die Regierung der Metropole Tokio hat Daten über die Anzahl der mit COVID-19 infizierten Personen veröffentlicht. Ich möchte diese CSV-Daten verarbeiten.
Anzahl der von der Tokyo Metropolitan Government angekündigten Infizierten https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068/resource/c2d997db-1450-43fa-8037-ebb11ec28d4c (CSV-Datei) https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
Die offizielle Dokumentation zeigt, wie die CSV-Datei gelesen wird. https://docs.python.org/ja/3/library/csv.html
Erstellen Sie in diesem Zusammenhang ein Programm, das die in 1 heruntergeladene CSV-Datei liest.
python
import csv
with open('130001_tokyo_covid19_patients.csv') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
print('■'.join(row))
Wenn ich das mache, bekomme ich die folgende Fehlermeldung
UnicodeDecodeError: 'cp932' codec can't decode byte 0xef in position 0: illegal multibyte sequence
Sicherlich war cp932 ein Wort mit einer Bedeutung wie S-JIS. Als ich den Zeichencode der CSV-Datei überprüfte, war es UTF-8.
Für die Bewältigungsmethode habe ich auf diesen Artikel verwiesen. Python UTF-8 CSV-Datei lesen (UnicodeDecodeError kompatibel)
Es wird empfohlen, encoding = "utf_8" für open anzugeben.
Dies ist der vollständige Code
python
import csv
with open('130001_tokyo_covid19_patients.csv', encoding="utf_8") as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in reader:
print('■'.join(row))
Die "Zeile" in 3 war eine Listenklasse. Von nun an möchte ich täglich addieren, Es scheint so mühsam zu sein, wie es ist. Es scheint einfacher zu sein, Pandan zu benutzen, also denke ich, ich werde es mit Pandas neu machen ...
Recommended Posts