[PYTHON] Trier en spécifiant les conditions dans CASTable

SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous expliquer comment trier les données dans CASTable.

Obtenir une table de la base de données

Tout d'abord, connectez-vous à SAS Viya.

import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')

Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.

tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable

Trier

Le tri utilise la méthode sort_values.

tbl.sort_values(['sepal_length', 'sepal_width'])

Vérifions les données dans cet état. La méthode head part de la première ligne.

sorttbl.head(10)
sepal_length sepal_width petal_length petal_width species
0 4.3 3.0 1.1 0.1 setosa
1 4.4 2.9 1.4 0.2 setosa
2 4.4 3.0 1.3 0.2 setosa
3 4.4 3.2 1.3 0.2 setosa
4 4.5 2.3 1.3 0.3 setosa
5 4.6 3.1 1.5 0.2 setosa
6 4.6 3.2 1.4 0.2 setosa
7 4.6 3.4 1.4 0.3 setosa
8 4.6 3.6 1.0 0.2 setosa
9 4.7 3.2 1.6 0.2 setosa

L'ordre inverse utilise la méthode «tail».

sorttbl.tail(5)
sepal_length sepal_width petal_length petal_width species
145 7.7 2.6 6.9 2.3 virginica
146 7.7 2.8 6.7 2.0 virginica
147 7.7 3.0 6.1 2.3 virginica
148 7.7 3.8 6.7 2.2 virginica
149 7.9 3.8 6.4 2.0 virginica

Spécifiez l'ordre croissant et décroissant

Vous pouvez spécifier l'ordre en détail avec l'option «ascendant».

sorttbl = tbl.sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])

Si vous regardez les données maintenant, l'ordre des données devrait avoir changé.

sepal_length sepal_width petal_length petal_width species
0 7.9 3.8 6.4 2.0 virginica
1 7.7 2.6 6.9 2.3 virginica
2 7.7 2.8 6.7 2.0 virginica
3 7.7 3.0 6.1 2.3 virginica
4 7.7 3.8 6.7 2.2 virginica
5 7.6 3.0 6.6 2.1 virginica
6 7.4 2.8 6.1 1.9 virginica
7 7.3 2.9 6.3 1.8 virginica
8 7.2 3.0 5.8 1.6 virginica
9 7.2 3.2 6.0 1.8 virginica

Résumé

Le tri des données est une opération de base. Lors de l'utilisation de sort_values, spécifiez les conditions en détail comme une option.

SAS for Developers | SAS

Recommended Posts

Trier en spécifiant les conditions dans CASTable
Trier les éléments d'un tableau en spécifiant des conditions
Trier par date en python
[Python] Tri itérable selon plusieurs conditions
Lors de la spécification de plusieurs clés dans le tri python
Suivez en spécifiant les conditions à l'aide de tweepy
Comment trier en spécifiant une colonne dans le tableau Python Numpy.
Trier la liste des tuples en Python en spécifiant l'ordre croissant / décroissant de plusieurs clés
Tri à bulles en Python
[Python] Récupère l'élément en spécifiant l'attribut name dans BeautifulSoup
Accédez à Github en spécifiant la clé SSH dans GitPython
Tri personnalisé en Python3
Différences de prix par préfecture (2019)
Trier par valeur de valeur de type dict
Trier naturellement le chemin en Python
Trier par date de modification du fichier
Trier les noms de fichiers obtenus par Python glob dans l'ordre numérique
[Python] Obtenez des éléments en spécifiant des attributs avec une recherche de préfixe dans BeautifulSoup
Le tri du tableau de tuple peut être accéléré en spécifiant une clé (Python)