[PYTHON] Vérifiez le résumé des données dans CASTable

SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous présenter comment changer les conditions d'extraction lors de l'affichage de l'état des données dans CASTable.

Obtenir une table de la base de données

Tout d'abord, connectez-vous à SAS Viya.

import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')

Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.

tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable

Vérifiez les informations

Utilisez la méthode describe pour voir les données dont vous disposez.

tbl.describe()

Le résultat sera renvoyé comme suit. Vous pouvez voir le nombre de lignes, l'écart type, la valeur minimale, la valeur maximale et les données d'une valeur de 25% / 50% / 75%.

sepal_length sepal_width petal_length petal_width
count 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667
std 0.828066 0.433594 1.764420
min 4.300000 2.000000 1.000000
25% 5.100000 2.800000 1.600000
50% 5.800000 3.000000 4.350000
75% 6.400000 3.300000 5.100000
max 7.900000 4.400000 6.900000

Changer le pourcentage

Changer les percentiles changera les données récupérées. Voici un exemple de changement de données à 30% et 80%.

tbl.describe(percentiles=[0.3, 0.8])
sepal_length sepal_width petal_length petal_width
count 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667
std 0.828066 0.433594 1.764420
min 4.300000 2.000000 1.000000
30% 5.250000 2.800000 1.700000
50% 5.800000 3.000000 4.350000
80% 6.550000 3.400000 5.350000
max 7.900000 4.400000 6.900000

Voir le tout

Spécifiez ʻinclude = 'all'` pour vérifier toutes les données.

tbl.describe(include='all')
sepal_length sepal_width petal_length petal_width species
count 150 150 150 150
unique 35 23 43 22
top 5 3 1.5 0.2
freq 10 26 14 28
mean 5.84333 3.054 3.75867 1.19867
std 0.828066 0.433594 1.76442 0.763161
min 4.3 2 1 0.1
25% 5.1 2.8 1.6 0.3
50% 5.8 3 4.35 1.3
75% 6.4 3.3 5.1 1.8
max 7.9 4.4 6.9 2.5

Le nombre peut également être un nombre à virgule flottante.

tbl.describe(stats='all')
sepal_length sepal_width petal_length petal_width
count 1.500000e+02 1.500000e+02 1.500000e+02
unique 3.500000e+01 2.300000e+01 4.300000e+01
mean 5.843333e+00 3.054000e+00 3.758667e+00
std 8.280661e-01 4.335943e-01 1.764420e+00
min 4.300000e+00 2.000000e+00 1.000000e+00
25% 5.100000e+00 2.800000e+00 1.600000e+00
50% 5.800000e+00 3.000000e+00 4.350000e+00
75% 6.400000e+00 3.300000e+00 5.100000e+00
max 7.900000e+00 4.400000e+00 6.900000e+00
nmiss 0.000000e+00 0.000000e+00 0.000000e+00
sum 8.765000e+02 4.581000e+02 5.638000e+02
stderr 6.761132e-02 3.540283e-02 1.440643e-01
var 6.856935e-01 1.880040e-01 3.113179e+00
uss 5.223850e+03 1.427050e+03 2.583000e+03
cv 1.417113e+01 1.419759e+01 4.694272e+01
tvalue 8.642537e+01 8.626430e+01 2.609020e+01
probt 3.331256e-129 4.374977e-129 1.994305e-57

Résumé

Vous pouvez utiliser la méthode describe pour obtenir une vue d'ensemble des données dans CASTable. Veuillez l'utiliser comme base pour l'analyse des données.

SAS for Developers | SAS

Recommended Posts

Vérifiez le résumé des données dans CASTable
Vérifiez le comportement du destroyer en Python
Obtenez la liste des colonnes et la liste des données de CASTable
Vérifiez si l'URL existe en Python
J'ai essayé de sauvegarder les données récupérées au format CSV!
Stocker les données RSS dans Zabbix (vérification externe)
Exporter les données CASTable
Vérifiez si les caractères sont similaires en Python
L'histoire de la lecture des données HSPICE en Python
Vérifiez l'état des données à l'aide de pandas_profiling
Vérifiez si la chaîne est un nombre en python
Résumé des outils nécessaires pour analyser les données en Python
Vérifiez si la colonne attendue existe dans Pandas DataFrame
Échantillonnage dans des données déséquilibrées
À propos de l'inefficacité du transfert de données dans luigi on-memory
[Django] Perform Truncate Table (supprimer toutes les données de la table)
Vérifiez s'il s'agit d'Unix dans le langage de script
Ne pas être conscient du contenu des données en python
Utilisons les données ouvertes de "Mamebus" en Python
Vérifier l'existence de tables BigQuery en Java
Essayez de déchiffrer les données de connexion stockées dans Firefox
Vérifiez s'il s'agit d'Unix dans le langage de script
Vérifiez la nature atrophique de la distribution de probabilité en Python
Résumé des processus souvent effectués par Pandas 2 (référence des données, opération d'édition)
Essayez de gratter les données COVID-19 Tokyo avec Python
[python] Comment vérifier si la clé existe dans le dictionnaire
Code de test pour vérifier les liens brisés dans la page
[Pandas] Si les données de la première ligne sont dans l'en-tête de DataFrame
Différentes façons de calculer la similitude entre les données avec python
Résumé des points d'achoppement à Django pour la première fois
Maîtrisez le type avec Python? (Quand faire la vérification de type)
Vérifiez à l'avance ce qui se passe lorsque la commande est exécutée
[Comprendre au plus court] Principes de base de Python pour l'analyse des données
[Homologie] Comptez le nombre de trous dans les données avec Python
Structures de données de type liste et leurs opérations dans le noyau Linux
Cochez le bouton Vérifier dans Tkinter pour autoriser la modification de l'entrée
La méthode minimale à retenir lors de l'agrégation de données avec Pandas
Gérer les données ambiantes en Python
résumé de la requête d'acquisition de données python-fitbit
Trouver des erreurs en Python
Manipuler des données en Python-essayez avec Pandas_plyr
Afficher les données UTM-30LX en Python
Gzip compresser les données en streaming
Écrire des données au format HDF
Méthodes disponibles dans la liste
Mémo récapitulatif des types de données Python
Vérifiez le code avec flake8
Résumé de la détection de visage en Python
Résumé de l'outil de vérification des expressions régulières
Vérifiez simplement Content-Type avec Flask (@content_type)
Nouveautés de Python 3.9 (Résumé)
[Python] Vérifiez les bibliothèques installées
Vérifiez si le fichier de paramètres est lu de manière simple à comprendre
[Apprentissage automatique] Vérifiez les performances du classificateur à l'aide de données de caractères manuscrites
Vérifiez si le hachage de mot de passe généré par PHP correspond en Python
Comment vérifier la taille de la mémoire d'une variable en Python
Comment vérifier la taille de la mémoire d'un dictionnaire en Python
[TensorFlow 2] Comment vérifier le contenu de Tensor en mode graphique
Vérifiez le résultat du dessin à l'aide de Plotly en incorporant CodePen dans Qiita
[Golang] Vérifiez si une chaîne de caractères spécifique est incluse dans la chaîne de caractères