Ich werde die Reihe von Schritten vom Lesen einer CSV-Datei basierend auf öffentlichen Daten der WHO bis zur grafischen Darstellung erläutern.
Die Referenzseite ist hier.
Die obige Site wird unter der Annahme erklärt, dass Sie über Grundkenntnisse in Python und Matplotlib verfügen.
In diesem Artikel werde ich die Punkte zusammenfassen, die ich nicht verstanden habe. Eine ergänzende Erklärung ist so geschrieben, dass auch Anfänger sie verstehen können.
Unser Ziel ist es, Folgendes zu erreichen:
Laden Sie zuerst die CSV.
import pandas as pd
#Datenerfassung
df = pd.read_csv("COVID-19.csv", index_col='Date', parse_dates=['Date'])
Ich importiere eine Bibliothek namens Pandas und lese eine CSV-Datei. pandas ist eine Bibliothek, die benutzerfreundliche Datenstrukturen und Datenanalysetools wie das Laden von CSVs bereitstellt.
Informationen zu den grundlegenden Inhalten des Japanischen finden Sie unter hier.
Die Argumente für pandas.read_csv () sind:
Es gibt viele andere Parameter, daher ist es zunächst verwirrend, aber ich denke, es ist in Ordnung, wenn Sie sie einzeln verstehen.
python
import matplotlib.dates as mdates
Es bezieht sich auf eine Bibliothek namens matplotlib. matplotlib ist eine Bibliothek, mit der Sie statische, animierte und interaktive Visualisierungen in nur wenigen Zeilen erstellen können.
Diesmal verwenden wir matplotlib.dates, um Zeitreihendaten mit der horizontalen Achse als Datum zu verarbeiten.
Sie können einen Alias hinzufügen, indem Sie der Importanweisung "as" hinzufügen. Sie können es aufrufen, indem Sie jedes Mal "mdates" anstelle von "matplotlib.dates" schreiben.
python
#Holen Sie sich Farbmuster
cmap = plt.get_cmap("tab10")
Dieses Mal muss jede Linie farbcodiert sein, um mehrere Daten in einem Diagramm anzuzeigen. Es ist schwierig, nacheinander über Farben nachzudenken, daher handelt es sich um eine Bibliothek mit einem geeigneten Farbmuster.
Es ist ein Bild, das die zu lesende cmap entsprechend der Anzahl der anzuzeigenden Zeilen umschaltet.
Verwenden Sie mit matplotlib viele Farben
python
#Definieren Sie die einzustellende Skala
locator = mdates.AutoDateLocator()
formatter = mdates.ConciseDateFormatter(locator)
Beim Erstellen eines Diagramms gibt es verschiedene Entscheidungen, z. B. Skalierungseinheiten. Der obige Prozess kann wie folgt kurz erklärt werden.
python
ax = plt.gca()
Mit "plt.gca ()" wird das aktuelle Axes-Objekt erfasst und als "ax" -Objekt festgelegt.
Es scheint, dass es viele Menschen gibt, die Zweifel an Achsenobjekten und Figurenobjekten haben.
Das Bild ist wie folgt.
Objekt | Erläuterung | Eltern-Kind-Beziehung |
---|---|---|
Figurenobjekt | Umriss der Figur | Erster Elternteil |
Achsen Objekt | Bildbereich mit Datenraum | Abbildung Kinderklasse |
Achsenobjekt | Skalieren (Markierung auf der Achse) und Skalierungsbeschriftung (Zeichenfolge zum Beschriften der Skalierung) | Achsen Kinderklasse |
Wenn Sie das oben Genannte im Detail verstehen möchten, können die folgenden Artikel hilfreich sein.
[Grundkenntnisse über Matplotlib, die ich früh kennenlernen wollte, oder die Geschichte eines Künstlers, der das Erscheinungsbild anpassen kann](https://qiita.com/skotaro/items/08dc0b8c5704c94eafb9#figure-axes-axis%E3%81%AF%E9 % 9A% 8E% E5% B1% A4% E6% A7% 8B% E9% 80% A0% E3% 81% AB% E3% 81% AA% E3% 81% A3% E3% 81% A6% E3% 81 % 84% E3% 82% 8B)
#Reflektieren Sie die definierte Achsenskala im Diagramm
ax.xaxis.set_major_locator(locator)
ax.xaxis.set_major_formatter(formatter)
#Zeichnung
ax.plot(df.index, df['Global Confirmed'], "s-", color=cmap(3))
ax.plot(df.index, df['China Confirmed'], "o-", color=cmap(2))
ax.plot(df.index, df['Global Deaths'], "s-", color=cmap(7))
ax.plot(df.index, df['China Deaths'], "o-", color=cmap(6))
#Zeichnen Sie Gitterhilfslinien
ax.grid()
#Protokollskalenanzeige der y-Achse
plt.yscale('log')
#Legende anzeigen
plt.legend(['Global Confirmed', 'China Confirmed','Global Deaths', 'China Deaths'])
#Datei speichern
plt.savefig('COVID-19.svg', bbox_inches="tight") #Wenn svg auf png eingestellt ist, kann es als Bild gespeichert werden
Die Anzeigeergebnisse sind wie folgt.
In Bezug auf das angezeigte Diagramm ist die horizontale Achse das Datum und die vertikale Achse die Anzahl der Personen.
Wenn Sie eine solche Person sind, können Sie dies lesen, um das Step-up-Verfahren zum effizienten Lernen von maschinellem Lernen zu verstehen.
Hier finden Sie auch eine Referenz für bestimmte Methoden zum Erlernen von Python.
■ COVID-19 ■ Grundkenntnisse über Matplotlib, die ich früh kennenlernen wollte, oder die Geschichte eines Künstlers, der das Erscheinungsbild anpassen kann
Recommended Posts