Ich habe die Daten der neuen Person, die mit dem Corona-Virus infiziert ist, in Ichikawa, Präfektur Chiba, wo ich wohne, zusammengefasst.
Erstens gibt die Ichikawa City Homepage keine Informationen in einem Format weiter, das sekundär als offene Daten verwendet werden kann. Es sind nicht viele Daten, es gibt nur wenige Elemente und es reicht nicht aus, etwas damit zu versuchen, aber es scheint, dass es für kleine Dinge verwendet werden kann, also habe ich versucht, es einfach zu verwenden. Ich habe auch den Beispielcode (Python) gepostet.
Es wird von Zeit zu Zeit aktualisiert, kann sich jedoch aus persönlichen Gründen verzögern.
[2020/05/08] Todesdatum hinzugefügt
URL https://github.com/mine820/COVID-19
Im CSV-Format lautet der Zeichencode UTF-8.
Die Bedeutungen der Spalten sind wie folgt.
--Kategorie
Beispielcode zur Analyse anhand von Daten. Die Datei ist ein Jupyter-Notizbuch.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('corona.csv')
df["Datum des Beginns"] = df["Datum des Beginns"].replace("Unbekannt", "")
df["Datum des Beginns"] = df["Datum des Beginns"].replace("Nachforschungen anstellen", "")
df["Datum des Beginns"] = pd.to_datetime(df["Datum des Beginns"], format="%Y-%m-%d")
df["Datum der Bestätigung der Inspektion"] = df["Datum der Bestätigung der Inspektion"].replace("Unbekannt", "")
df["Datum der Bestätigung der Inspektion"] = df["Datum der Bestätigung der Inspektion"].replace("Nachforschungen anstellen", "")
df["Datum der Bestätigung der Inspektion"] = pd.to_datetime(df["Datum der Bestätigung der Inspektion"], format="%Y-%m-%d")
df["Sterbedatum"] = df["Sterbedatum"].replace("Unbekannt", "")
df["Sterbedatum"] = df["Sterbedatum"].replace("Nachforschungen anstellen", "")
df["Sterbedatum"] = pd.to_datetime(df["Sterbedatum"], format="%Y-%m-%d")
#Zusammengefasste Statistiken
df.describe().loc[:,"Jahr"]
#Histogramm (Alter)
plt.title("Age")
plt.yticks([0,5,10,15,20])
plt.hist(df["Jahr"], range=(0, 100));
#Inspektionsbestätigungsdatum + gleitender Durchschnitt (7 Tage)
days = (df["Datum der Bestätigung der Inspektion"].max()-df["Datum der Bestätigung der Inspektion"].min()).days
hist = plt.hist(df["Datum der Bestätigung der Inspektion"], bins=days)
left = np.array(range(days))
num = 7
b = np.ones(num) / num
y2 = np.convolve(hist[0], b, mode='same')
plt.title("Inspection confirmation date")
plt.bar(left, hist[0], color='green');
plt.plot(y2, color='red')
Recommended Posts