La norme pour dessiner des graphiques Python est "matplotlib", mais il a été souligné que son apparence est un peu démodée et que la notation est compliquée. Par conséquent, dans cet article, je vais discuter de la façon d'utiliser "Seaborn", qui est un wrapper pour réaliser les fonctions de Matplotlib plus magnifiquement et plus facilement.
◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html
Dans l'article ci-dessus, Matplotlib et Seaborn sont écrits comme suit.
À propos de matplotlib
Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity. You can typically do anything you need using matplotlib but it is not always so easy to figure out.
À propos de Seaborn
Seaborn is a visualization library based on matplotlib. It seeks to make default data visualizations much more visually appealing. It also has the goal of making more complicated plots simpler to create. It does integrate well with pandas.
En bref
matplotlib peut faire beaucoup de choses, mais c'est compliqué à gérer et Mendo (´ ・ ω ・ `) seaborn est basé sur matplotlib, mais il est plus beau et plus facile à appliquer, donc c'est génial (; ´∀ `)
C'est vrai. (adapté)
installer seaborn (Si vous n'avez pas matplotlib, incluez matplotlib)
pip install seaborn
Préparation du colis et préparation des données Seaborn est livré avec des données bien connues par défaut, je vais donc les utiliser pour l'analyse.
setup.py
import numpy as np
import pandas as pd
import seaborn as sns
x = np.random.normal(size=100) #Créer des données aléatoires sous forme de tableau numpy
titanic = sns.load_dataset("titanic") ##Données de vie et de mort du Titanic, célèbre pour Kaggle
tips = sns.load_dataset("tips") ##Données sur la relation entre l'heure du repas du restaurant, le montant total comptable et les chips
iris = sns.load_dataset("iris") ##Données statistiques d'Ayame familier avec R
Dans Seaborn, les histogrammes peuvent être dessinés avec une méthode appelée "distplot".
kde est une option de dessin pour la fonction d'approximation de la densité, et bins est la spécification de l'encoche de l'axe x. Pour les tapis, essayez ce qui se passe lorsque vous le définissez sur True.
distplot.py
sns.distplot(x, kde=False, rug=False, bins=10)
Dans Seaborn, les diagrammes de dispersion peuvent être dessinés avec une méthode appelée "joint plot". Essayons avec les données d'iris lues ci-dessus.
jointplot.py
sns.jointplot('sepal_width', 'petal_length', data=iris)
Eh bien, la distribution de chacune des valeurs de l'axe des x et de l'axe des y peut être vue en même temps dans l'histogramme, ce qui est magnifique.
De plus, ce diagramme de dispersion est facilement visible pour toutes les variables numériques incluses dans les données. Utilisez une méthode appelée "diagramme de paires".
pairplot.py
sns.pairplot(iris)
Vous pouvez voir immédiatement quelles variables sont fortement corrélées.
Il est également possible de coder en couleur les variables catégorielles. Utilisez l'option appelée teinte.
Selon weblio, http://ejje.weblio.jp/content/hue
[Nez indénombrable] [Plus précisément, [Nez indénombrable]] une ombre, de l'ombre. exemple un changement de teinte. b couleur. exemple une teinte froide [chaude] couleur froide [chaude].
Il semble que le mot «teinte» ait le sens. C'est le premier mot que j'ai entendu quand je suis né
pairplot2.py
sns.pairplot(iris, hue="species")
La partie 2 couvrira le barplot, le boxplot, le strip-tlot, etc. http://qiita.com/hik0107/items/7233ca334b2a5e1ca924
Belle carte de chaleur à Seaborn http://qiita.com/hik0107/items/67ad4cfbc9e84032fc6b
Comment dessiner plusieurs graphiques à la fois avec Seaborn est super pratique http://qiita.com/hik0107/items/865b75ae486728cb0006
Si vous êtes intéressé par les data scientists, regardez d'abord ici, un résumé de la littérature et des vidéos http://qiita.com/hik0107/items/ef5e044d2f47940ba712
Il est temps de réfléchir sérieusement à la définition et à l'ensemble des compétences des data scientists http://qiita.com/hik0107/items/f9bf14a7575d5c885a16
Recommended Posts