Einführung in ** Altair **, Pythons Datenvisualisierungsbibliothek. Da es auf Japanisch nur wenige Informationen gibt, werde ich einen Artikel für Missionare schreiben. Wenn Sie mit Englisch vertraut sind, ist es am einfachsten, die offizielle Seite zu sehen.
Es kann einfach mit dem Befehl pip
installiert werden. vega_datasets
wird später verwendet, also lasst es uns zusammen installieren.
pip install altair vega_datasets
Ich habe Google Colaboratory verwendet und es hat von Anfang an ohne Installation funktioniert.
Laden Sie die Bibliothek und den Datensatz unten.
import altair as alt
from vega_datasets import data
iris = data.iris()
Altair kann gut mit Pandas arbeiten, und "Iris" ist der DataFrame von Pandas.
Das Folgende ist der angenommene Code, der direkt mit Jupyter usw. visualisiert werden soll. Wenn Sie in HTML ausgeben möchten, fügen Sie am Ende .save (" filename.html ")
hinzu. Sie müssen nicht .interactive ()
haben, aber wenn Sie es schreiben, können Sie das Diagramm verschieben. ** Dieser Artikel ist ein normales Bild. Wenn Sie ihn verschieben möchten, verwenden Sie bitte hier **.
Geben Sie die Werte für die x- und y-Achse wie folgt an: Sie können auch alt.X () wie einen Kommentar schreiben und dies für eine komplizierte Visualisierung verwenden.
alt.Chart(iris).mark_point().encode(
x="sepalLength", # alt.X("sepalLength"),
y="sepalWidth", # alt.Y("sepalWidth"),
color="species"
).interactive()
Der Punkt ist, den Durchschnitt für jede "Art" mit "Durchschnitt ()" zu nehmen. Sie können verschiedene andere Operationen als den Durchschnitt ausführen und die Liste unter [hier] überprüfen (https://vega.github.io/vega-lite/docs/aggregate.html#ops).
alt.Chart(iris).mark_bar().encode(
x="average(sepalLength)", # alt.X("sepalLength", aggregate="average"),
y="species", # alt.Y("species"),
).interactive()
Der Punkt ist so. Wenn Sie den Teil make_xxxxx
durch make_line
ersetzen, können Sie einfach ein Liniendiagramm zeichnen. Wenn Sie ein Problem haben, können Sie es normalerweise lösen, indem Sie auf der offiziellen Seite unter Galerie nach einem ähnlichen Diagramm suchen.
Die durch das Tooltip-Argument angegebenen Informationen werden mit der Maus angezeigt.
alt.Chart(iris).mark_point().encode(
x="sepalLength",
y="sepalWidth",
color="species",
tooltip=["sepalLength", "sepalWidth", "petalLength", "petalWidth", "species"]
).interactive()
Quantitative Daten werden grundsätzlich einschließlich 0 visualisiert. Die obige Grafik zeigt deutlich, dass sie keine 0 mit "Null = Falsch" enthält.
alt.Chart(iris).mark_point().encode(
alt.X("sepalLength", scale=alt.Scale(zero=False)),
alt.Y("sepalWidth", scale=alt.Scale(zero=False)),
color="species"
).interactive()
Die nominale Skala ist oft eine ganze Zahl, nicht wahr? Geben Sie in diesem Fall an, dass es sich um eine nominelle Skala handelt, z. B. "species_int: N". Die Ordnungsskala lautet übrigens ": O" und für quantitative Daten ": Q". Details finden Sie in der offiziellen Dokumentation hier.
#In einen ganzzahligen Wert konvertieren(setosa: 0, versicolor: 1, virginica: 2)
iris["species_int"] = [["setosa", "versicolor", "virginica"].index(x) for x in iris["species"]]
#Richtiges Beispiel
alt.Chart(iris).mark_point().encode(
x="sepalLength",
y="sepalWidth",
color="species_int:N"
).interactive()
Übrigens, ohne : N
wird es wie folgt sein.
Ich werde wütend, wenn ich 5000 Zeilen überschreite. Führen Sie die folgenden Schritte unter Bezugnahme auf die Informationen in [hier] aus (https://altair-viz.github.io/user_guide/faq.html#maxrowserror-how-can-i-plot-large-datasets).
alt.data_transformers.disable_max_rows()
Es kann einfach beschrieben werden und ist praktisch für die explorative Analyse. Wenn es einen Nachteil gibt, ist die HTML-Ausgabe einfach, aber die PNG-Ausgabe scheint etwas schwierig zu sein. Zu Ihrer Information!
Recommended Posts