[PYTHON] Principes de base de Tableau (visualisation à l'aide d'informations géographiques)

Récemment, j'ai résumé l'utilisation de base de l'outil de BI "Tableau" présenté comme un ensemble avec AWS. "Tableau" est un outil très simple, de sorte que toute personne qui peut utiliser Excel peut facilement visualiser les données.

3 août 2019 Ajouté Certaines informations ont été mises à jour et rééditées et publiées sur mon blog. Jetez un œil à ceci. https://tadaken3.hatenablog.jp/entry/tableau-map

Veuillez également consulter les sites suivants pour «Tableau».

Cette fois, j'utilise tableau Public, qui peut être utilisé gratuitement. Il est fonctionnellement identique à la version commerciale de tableau Desktop. Cliquez ici pour le site DL ↓ https://public.tableau.com/s/

Préparation des données

En utilisant le module Pandas de Python, Les données sont obtenues à partir de la page «Liste de la population par préfecture» de Wikipédia. ~~ (tableau public ne peut gérer que les fichiers texte, il génère donc des fichiers CSV. Avec la version du produit, vous pouvez obtenir des données directement à partir de la base de données) ~~

À partir de tableau 10.0, tableau public prend désormais en charge les feuilles de calcul Google et le connecteur de données Web. De plus, lorsque la feuille de calcul Google est mise à jour, elle sera automatiquement mise à jour par traitement de la date et de l'heure. tableau public Trop de début. (Ajout: 2016-10-05)

import pandas as pd

url = 'https://ja.wikipedia.org/wiki/%E9%83%BD%E9%81%93%E5%BA%9C%E7%9C%8C%E3%81%AE%E4%BA%BA%E5%8F%A3%E4%B8%80%E8%A6%A7'
fetched_dataframes = pd.read_html(url, header = 0)
df = fetched_dataframes[0]
df.to_csv("population.csv", index = False,encoding='utf-8')	 

Lire les données

Lancez tableau public et chargez le fichier CSV. Aucun réglage spécial n'est requis. (C'est un fichier appelé population.csv)

スクリーンショット 2015-11-26 22.49.48.png

Visualisation de données

Cette fois, j'aimerais calculer le taux d'augmentation / diminution de la population pour chaque préfecture et le visualiser sur une carte. Premièrement, nous calculerons le taux d'augmentation / diminution de la population. Je vais entrer la formule de calcul comme Excel. Je ne l'ai pas utilisé cette fois, mais il a un ensemble de fonctions, donc c'est vraiment facile à calculer comme Excel.

スクリーンショット 2015-11-26 22.22.45.png

Puisque nous voulons utiliser une carte cette fois, spécifiez "Rôle géographique" pour la dimension "Préfecture". Puisqu'il s'agit d'un outil américain, c'est un "état", mais si vous le spécifiez, il reconnaîtra correctement les préfectures du Japon. スクリーンショット 2015-11-26 22.21.35.png

Si vous double-cliquez sur une préfecture, "Tableau" la reconnaîtra automatiquement et sélectionnera l'expression visuelle la plus appropriée. Dans ce cas, la carte s'affiche car les informations géographiques sont définies. (Bien sûr, vous pouvez également le définir vous-même.) Cette fois, je voudrais l'exprimer en couleur par le taux d'augmentation / diminution de la population, alors mettez la mesure du «taux d'augmentation / diminution de la population» créé plus tôt dans la partie marquée. スクリーンショット 2015-11-26 22.23.42.png

Sélectionnez «Taux d'augmentation / diminution de la population» et spécifiez «Couleur». スクリーンショット 2015-11-26 22.23.51.png Ensuite, chaque préfecture sera codée par couleur en fonction du taux d'augmentation / diminution de la population. Sauf pour Kanto, il est presque rouge vif. スクリーンショット 2015-11-26 23.09.00.png

Le reste est complété par des compléments de formats et de commentaires. Le fichier complété peut être téléchargé et publié sur le site officiel de tableau publlic. C'est comme ça.

都道府県別の人口増減率.png

Recommended Posts

Principes de base de Tableau (visualisation à l'aide d'informations géographiques)
python: principes de base de l'utilisation de scikit-learn ①
Visualisation de matrices mixtes à l'aide de sklearn.metrics.ConfusionMatrixDisplay
Bases de la théorie de l'information quantique: Entropie (2)
Python: principes de base de la reconnaissance d'image à l'aide de CNN
Bases de la théorie de l'information quantique: compression de données (1)
Bases de la théorie de l'information quantique: distance de trace
Bases de la théorie de l'information quantique: tomographie d'état quantique
Bases de la théorie de l'information quantique: compression de données (2)
Comment utiliser Folium (visualisation des informations de localisation)
[Pandas] Principes de base du traitement des données de date à l'aide de dt
Les bases de Python ①
Bases de la théorie de l'information quantique: codes de surface topologique
Bases de la théorie de l'information quantique: calcul quantique tolérant aux pannes
Visualisation des informations géographiques de R et Python qui peuvent être exprimées par Power BI
Bases de l'écran d'entrée / sortie en utilisant tkinter en python3
Bases de la théorie de l'information quantique: correction d'erreur quantique (code Shor)
Visualisation bidimensionnelle des vecteurs de documents à l'aide du modèle entraîné Word2Vec
Bases de la théorie de l'information quantique: correction d'erreur quantique (code du stabilisateur: 4)
Principes de base du grattage Python
# 4 [python] Bases des fonctions
Bases des programmes réseau?
La fondation de la fondation Perceptron
Bases de l'analyse de régression
Exemple d'utilisation de lambda
Bases de python: sortie
Bases de la théorie de l'information quantique: correction d'erreur quantique (code linéaire classique)
Bases de la théorie de l'information quantique: calcul quantique universel par code de surface (1)
Utilisation de MLflow avec Databricks ② --Visualisation des paramètres expérimentaux et des métriques -