Ministerium für Gesundheit, Arbeit und Soziales, häusliche Ausbruchsituation usw. Daten öffnen
Datenbereinigung, da csv \ n Zeilenvorschubzeichen enthält und sich der Vergleich vom Vortag in derselben Zelle befindet
import re
import pandas as pd
df = pd.read_csv("https://www.mhlw.go.jp/content/current_situation.csv", index_col=0)
df.index = df.index.str.replace(r"※\d", "").str.replace(",", "").str.replace(r"\\n", "")
df.columns = df.columns.str.replace(r"※\d", "").str.replace(r"\\n", "").str.strip()
df = df.applymap(lambda s: re.sub(r"※\d", "", s))
dfs = []
for name, col in df.iteritems():
df_tmp = col.str.split(r"\\n", expand=True).rename(columns={0: "Kumulativ", 1: "Der Tag vor Verhältnis"})
df_tmp.columns = pd.MultiIndex.from_product([[name], df_tmp.columns])
dfs.append(df_tmp)
df = pd.concat(dfs, axis=1).fillna(0)
df = df.applymap(lambda s: str(s).replace(",", "").strip().strip("()")).astype(int)
df.to_csv("current_situation.csv", encoding="utf_8_sig")
Recommended Posts