SAS Viya ist eine KI-Plattform. Es ist in Sprachen wie Python, Java und R verfügbar. In SAS Viya wird ein Tabellenobjekt namens CASTable verwendet (CAS steht für Cloud Analytic Services). Dieses Mal werde ich versuchen, die Spalteninformationen von CASTable mit verschiedenen Methoden abzurufen.
Stellen Sie zunächst eine Verbindung zu SAS Viya her.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Dann holen Sie sich die CASTable. Dieses Mal werde ich CSV von IRIS-Daten verwenden.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Es ist in Ordnung, nur den Spaltennamen mit "for in" abzurufen.
for col in tbl:
print(col)
Die Ausgabe ist wie folgt.
sepal_length
sepal_width
petal_length
petal_width
species
Verwenden Sie die Funktion "Aufzählung", um den Index zusätzlich zum Spaltennamen abzurufen.
for i, col in enumerate(tbl):
print(i, col)
Die Ausgabe ist wie folgt.
0 sepal_length
1 sepal_width
2 petal_length
3 petal_width
4 species
Verwenden Sie die Funktion "zip", um den Typ zusätzlich zum Spaltennamen abzurufen.
for col, dtype in zip(tbl, tbl.dtypes):
print(col, dtype)
Die Ausgabe ist wie folgt.
sepal_length double
sepal_width double
petal_length double
petal_width double
species varchar
Verwenden Sie die Methode "iteritems", um sie als "CASColumn" abzurufen, die detailliertere Informationen erhalten kann.
for col, obj in tbl.iteritems():
print(col, obj)
print('')
Die Ausgabe ist wie folgt.
sepal_length CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_length'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
sepal_width CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
petal_length CASColumn('DATA.IRIS', caslib='CASUSER(username)')['petal_length'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
petal_width CASColumn('DATA.IRIS', caslib='CASUSER(username)')['petal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
species CASColumn('DATA.IRIS', caslib='CASUSER(username)')['species'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
Als nächstes erfahren Sie, wie Sie die Daten zeilenweise abrufen. Die erste ist bei Verwendung der "iterrows" -Methode.
for row in tbl.iterrows():
print(row)
Die Ausgabe ist wie folgt. Insgesamt gibt es 150 Zeilen.
(0, sepal_length 7.9
sepal_width 3.8
petal_length 6.4
petal_width 2
species virginica
Name: 0, dtype: object)
(1, sepal_length 7.7
sepal_width 2.6
petal_length 6.9
petal_width 2.3
species virginica
:
Name: 148, dtype: object)
(149, sepal_length 4.3
sepal_width 3
petal_length 1.1
petal_width 0.1
species setosa
Name: 149, dtype: object)
Als nächstes wird die Methode "itertuples" verwendet.
for row in tbl.itertuples():
print(row)
Das Ergebnis ist wie folgt, nur der Wert wird zurückgegeben.
(0, 7.9000000000000004, 3.7999999999999998, 6.4000000000000004, 2.0, 'virginica')
(1, 7.7000000000000002, 2.6000000000000001, 6.9000000000000004, 2.2999999999999998, 'virginica')
:
(148, 4.4000000000000004, 3.2000000000000002, 1.3, 0.20000000000000001, 'setosa')
(149, 4.2999999999999998, 3.0, 1.1000000000000001, 0.10000000000000001, 'setosa')
Es gibt verschiedene Möglichkeiten, Spalteninformationen abzurufen. Bitte verwenden Sie es entsprechend Ihren Bedürfnissen.
Recommended Posts