[PYTHON] Afficher et analyser uniquement certaines colonnes dans CASTable

SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous présenter comment extraire uniquement certaines colonnes et afficher les informations dans CASTable.

Obtenir une table de la base de données

Tout d'abord, connectez-vous à SAS Viya.

import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')

Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.

tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable

Obtenez la colonne

Vous pouvez récupérer la colonne en spécifiant la clé avec tbl comme dict.

col = tbl['sepal_width']
col

La sortie ressemble à ceci:

CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])

Afficher les données

Si vous utilisez la méthode head d'une colonne, seule la valeur de cette colonne sera affichée.

col.head()
0    3.8
1    2.6
2    2.8
3    3.0
4    3.8
Name: sepal_width, dtype: float64

Obtenez plusieurs colonnes

De même, si vous donnez la clé sous forme de tableau, vous pouvez obtenir plusieurs colonnes.

widths = tbl[['sepal_width', 'petal_width', 'species']]

Le contenu est le suivant.

sepal_width petal_width species
0 3.8 2.0 virginica
1 2.6 2.3 virginica
2 2.8 2.0 virginica
3 3.0 2.3 virginica
4 3.8 2.2 virginica

Vous pouvez également consulter le résumé des données.

widths.describe()
sepal_width petal_width
count 150.000000 150.000000
mean 3.054000 1.198667
std 0.433594 0.763161
min 2.000000 0.100000
25% 2.800000 0.300000
50% 3.000000 1.300000
75% 3.300000 1.800000
max 4.400000 2.500000

Les informations de colonne s'affichent de la même manière.

widths.columninfo()
Column ID Type RawLength FormattedLength NFL NFD
0 sepal_width 2 double 8 12 0 0
1 petal_width 4 double 8 12 0 0
2 species 5 varchar 10 10 0 0

Résumé

Si vous obtenez des colonnes, vous pouvez limiter l'analyse à celles dont vous avez besoin, même si le tableau comporte de nombreuses colonnes. Il peut être utilisé lorsqu'il y a trop de données numériques et que vous ne savez pas où traiter l'analyse.

SAS for Developers | SAS

Recommended Posts

Afficher et analyser uniquement certaines colonnes dans CASTable
Comment utiliser les colonnes calculées dans CASTable
[Python] Permutation des lignes et des colonnes de données Numpy
Afficher les colonnes et les variables du numéro de série avec le modèle de bouteille
Lisez le fichier csv et affichez-le dans le navigateur