Aus der Governor's File der National Governor's Association, dem amtierenden Gouverneur Schaben
import datetime
import re
import pandas as pd
import matplotlib.pyplot as plt
def wareki2date(s):
m = re.search("(Showa|Heisei|Reiwa)([ 0-9 Yuan]{1,2})Jahr( [0-9]{1,2})Mond([ 0-9]{1,2})Tag", s)
if m:
year, month, day = [1 if i == "Ehemalige" else int(i.strip()) for i in m.group(2, 3, 4)]
if m.group(1) == "Showa":
year += 1925
elif m.group(1) == "Heisei":
year += 1988
elif m.group(1) == "Reiwa":
year += 2018
return pd.Timestamp(year, month, day)
else:
return pd.NaT
df = pd.read_html("http://www.nga.gr.jp/app/chijifile/", attrs={"summary": "Suchergebnisliste"})[0]
#Konvertieren Sie den japanischen Kalender in den westlichen Kalender
df["Geburtstag"] = df["Geburtstag"].apply(wareki2date)
df["Wahltermin"] = df["Wahltermin"].apply(wareki2date)
df["Haltbarkeitsdatum"] = df["Haltbarkeitsdatum"].apply(wareki2date)
df["Einweihungsdatum"] = df["Einweihungsdatum"].apply(wareki2date)
df["Alter"] = df["Alter"].str.rstrip("Alter").astype(int)
df["Alter"].value_counts(bins=[20,40,45,50,55,60,65,70,75,80]).sort_index().plot.bar()
df["Alter"].describe()
count 47.000000 mean 61.680851 std 9.273868 min 39.000000 25% 56.000000 50% 60.000000 75% 69.500000 max 78.000000 Name: Alter, Typ: float64
df["Anzahl der Siege"].describe()
count 47.000000 mean 2.765957 std 1.447828 min 1.000000 25% 1.000000 50% 3.000000 75% 4.000000 max 7.000000 Name: Anzahl der Siege, Typ: float64
In der Liste der National Mayors Association sind nur die Namen aufgeführt.
Recommended Posts