[PYTHON] Während ich Pandas studierte, machte ich eine kostenlose Studie darüber, wann Corona enden würde und ob das Sperren sinnvoll war.

Corona wird enden.

Es ist einen Monat her, seit die Notfallerklärung für das Corona-Virus veröffentlicht wurde. Seit ich in Europa für Forschungszwecke gearbeitet habe, leide ich seit Mitte März an diesem Virus. Jobs in Europa sind nicht mehr in diesem Aufruhr, und obwohl ich nach einem Job in Japan suche, ist es schwierig, von allen eine Antwort zu bekommen. (Danke für die Tatsache, dass es GW ist und es natürlich ist.) Es ist Zeitverschwendung, Zeit zu Hause zu verbringen, also habe ich einige kostenlose Nachforschungen angestellt, um zu sehen, ob Corona enden würde, und Pandas studiert.

Was zu verwenden

Unsere Welt in Datenkoronadatenbank (CSV-basiert)

Nur das war einfach und ich konnte keinen guten Kerl finden. Bitte unterrichten Sie, wenn Sie eine gute Datenbank haben. https://github.com/owid/covid-19-data/blob/master/public/data/owid-covid-data.csv

Wikipedia-Sperrseite

https://en.wikipedia.org/wiki/Curfews_and_lockdowns_related_to_the_2019%E2%80%9320_coronavirus_pandemic#cite_note-51

Jupyter und Pandas

Da dieser Bereich Herr Qiita ist, werde ich die Einführung weglassen.

Datenaufbereitung

Kochen Sie zuerst die Wikipedia-Seite in CSV.

Es ist wirklich schwer. Screen Shot 2020-05-03 at 15.46.51.png Lesen Sie csv und organisieren Sie die Daten nach Ländern

df=pd.read_csv('/home/username/COVID19/owid-covid-data.csv')
df.date = pd.to_datetime(df['date'], format='%Y-%m-%d')
countries=pd.read_csv('/home/username/COVID19/countries.csv')
countries.lockdown_begins=pd.to_datetime(countries['lockdown_begins'], format='%Y-%m-%d')
countries.lockdown_ends=pd.to_datetime(countries['lockdown_ends'], format='%Y-%m-%d')
countries=countries.dropna()
countries.index=countries.iso_code

Wenn ich Pandas betrete, sieht es so aus (ich habe ein wenig mit dem Index herumgespielt) Für Wiki (Sperrstartdatum, Enddatum (geplant)) Screen Shot 2020-05-03 at 15.54.02.png Rohdaten Screen Shot 2020-05-03 at 15.59.33.png

Nehmen Sie eine Teilmenge der Daten nach Land und indizieren Sie das Datum

def country(df,country_name):
    
    newdata=df.loc[df.iso_code==country_name]
    newdata.set_index(['date'],inplace=True)
    
    return newdata

Jetzt spielen wir mit den Daten.

Alles ist in Ordnung, also lasst uns planen

Lassen Sie uns also die Anzahl der bestätigten Infektionen, das Datum und die Uhrzeit des Todes sowie die kumulierte Gesamtzahl, die wir häufig sehen, grafisch darstellen. Immerhin scheint der gleitende 7-Tage-Durchschnitt gut zu sein, um Daten für Samstag und Sonntag zu vermeiden. Berechnen wir den gleitenden 7-Tage-Durchschnitt und die positive Rate.

def rolling_average(input):
    columns=input.columns
    
    input['new_tests2']=input['total_tests'].diff()

    for column in columns[2:13]:
        #Ist der gleitende Durchschnitt in dieser Zeile in Ordnung?
        input[column]=input[column].rolling(7).mean()
   #Die kumulative positive Rate und die tägliche positive Rate werden aus dem gleitenden Durchschnitt aller Fälle und der Anzahl der Tests (Anzahl der Personen) berechnet.
    input['positive_rate_total']=input['total_cases']/input['total_tests']
    input['positive_rate_diff']=input['new_cases']/input['new_tests2']

    return input

test_jpn.png Die Zahl der neu infizierten Personen im gleitenden Durchschnitt nimmt ab, und die Zahl der Todesfälle dürfte den Pass überschreiten. Genau das machen die Nachrichten. (Stand 3. Mai) Wie berichtet, scheint die tägliche PCR-Positivrate für das ganze Land bei etwa 10% zu liegen. Wenn die Daten nur für Tokio sind, sind sie ganz anders.

Hauptthema 1 Wie wirkt sich die Sperrung aus?

Nachdem die Nachrichten auf jupyter reproduziert wurden, wollen wir ihre Beziehung zur Sperrung untersuchen. Ich habe es die ganze Zeit gesehen (ich habe in den ersten drei Wochen, in denen ich in Europa war, jeden Tag nachgesehen). Free Financial Times-Artikel für jetzt Lassen Sie uns anhand des Tages zeichnen, an dem der gleitende Durchschnitt der Toten in Bezug auf 3 Personen betrug. Dies ist der Stichtag für die Verbreitung des Coronavirus in dieser kostenlosen Studie. Alle Parzellen werden durch den Maximalwert (die maximale Anzahl infizierter oder toter Personen) geteilt. japan.png Am Tag nach dem Tag, an dem die Notfallerklärung angekündigt wurde (4/6), war 4/7 der Tag, an dem die Zahl der Menschen drei wurde, und Japan befand sich in der Todesgrafik der Financial Times, die an diesem Tag noch nicht veröffentlicht worden war. Es erschien und es war äußerst schmerzhaft. Ich stellte mir eine Situation vor, in der eine Infektionsexplosion Zehntausende Menschen in Japan töten würde, und ich zitterte. Glücklicherweise war ich jedoch um den 17. April etwas erleichtert, nachdem ich in weniger als zwei Wochen den Höhepunkt neu infizierter Menschen überschritten hatte. Es war so, oder? Ich kann nichts über den Höhepunkt der Todesfälle sagen, aber die gleichen Grafiken in anderen Ländern liegen ungefähr zwei Wochen zurück. Lassen Sie uns also hoffnungsvoll beobachten, dass es letzte Woche vorbei ist. (Die Anzahl der Todesfälle scheint je nach medizinischer Situation im Land zu variieren.) Und wir werden am 25./4. Des 25. Tages sein. Die Stornierung der Notfallerklärung zum Monatsende befindet sich ganz rechts in der Grafik. Auf den ersten Blick scheint sich die Zahl der neu bestätigten Infektionen zu beruhigen. Natürlich können Sie diese Zahl aus verschiedenen Ländern machen. Der Inhalt ist jedoch der gleiche wie in der Financial Times. Schauen wir uns also England und Frankreich an, die uns zu Dank verpflichtet sind, und Australien, das in recht entwickelten Ländern gut abschneidet. gbr.png In Großbritannien stieg die Zahl der Infizierten und Todesfälle acht Tage nach dem mobilen Durchschnitt von drei Todesfällen in den nächsten zwei Wochen weiter an. Es tut mir sehr weh, mich um mich zu kümmern. Zu diesem Zeitpunkt besteht natürlich keine Chance zum Entsperren. Die Linie ganz rechts ist übrigens heute. traurig. fra.png Frankreich war spät in der Sperrung, aber durch die Verhängung eines strengen Ausreiseverbots und Geldstrafen für unnötiges Ausgehen wurde die Bewegung der Menschen erheblich eingeschränkt. Der Effekt ist jetzt sehr gut, und in Bezug auf die Anzahl wird immer noch bestätigt, dass täglich etwa 1.000 Menschen infiziert sind, aber die Zahl der neu infizierten Menschen sinkt im schlimmsten Fall auf 20% und die Zahl der Todesfälle nimmt ab. Zu dieser Zeit war ich verwirrt über die Strenge des Ausgehverbots, aber jetzt bekomme ich eine sehr hohe Wirkung. Die Linie ganz rechts ist das heutige Datum. aus.png Ich bin mit der Situation in Australien nicht sehr vertraut (ist sie nicht gesperrt?), Aber es scheint, dass internationale Flüge von einem sehr frühen Stadium an gestoppt wurden. (Dieser Tag wird anstelle des Sperrstartdatums verwendet.) Wie Sie sehen, ist der Effekt in Australien extrem hoch, wo Maßnahmen ergriffen wurden, bevor die Todesfälle auftraten, und die Höchstzahl der Infizierten endete, bevor die Zahl der Todesopfer drei erreichte. .. Das heißt, zum Zeitpunkt der drei Toten wurde es geklärt. Die Linie rechts ist 5/3 Tage. In diesem Fall können Sie bis Ende dieses Jahres zu Ihrem ursprünglichen Leben zurückkehren, wenn Sie vorsichtig ausgehen und Cluster (3 dicht) vermeiden.

Wie war es? Es ist eine einfache Grafik, aber ich glaube, Sie können die Bedeutung von Sperrung und Grenzschutz erkennen.

Hauptthema 2 Ekelhafte Grafik

Anscheinend war die Geschwindigkeit der Sperr- und Grenzmaßnahmen der Schlüssel zu Koronamaßnahmen. Ich nannte dies einen coolen Namen, Lockdown Delta, und versuchte, die Anzahl der Todesfälle und die Anzahl der Infizierten in den Top-50-Ländern mit der höchsten kumulierten Anzahl der Infizierten aufzuzeichnen, und es gab nur zwei interessante Zahlen. Der erste ist hier. Es ist eine sehr ekelhafte Grafik. Die vertikale Achse sind schließlich die Menschen, die wir verloren haben. Daily_max_death_vs_lockdown_speed.png (Ich sage Lockdown-Effizienz, aber es gibt einen Unterschied zwischen dem Tag, an dem ich gerade gesperrt habe, und der kumulierten Summe von 3 Toten. Es ist ein Lockdown-Delta. Lol) Das Lockdown-Delta wurde schneller gesperrt, als es nach links ging, und langsamer, als es nach rechts ging. Weist darauf hin, dass. Die gleitende durchschnittliche Zahl der Todesopfer wird vertikal berechnet. Wie Sie sehen können, besteht eine eindeutige Korrelation, ohne maschinelles Lernen oder Zeichnen einer Linie. Japan hat ein Lockdown-Delta von -1, daher denke ich, dass es unter anderen Ländern ziemlich gut ist. Es scheint, dass der Cluster von Ende Februar und der Effekt der Vermeidung von Dichte herausgekommen sind. Es gibt einige Debatten über die Abgabe einer Notfallerklärung eine Woche zuvor, aber es kann nicht geholfen werden.