SAS Viya ist eine KI-Plattform. Es ist in Sprachen wie Python, Java und R verfügbar. In SAS Viya wird ein Tabellenobjekt namens CASTable verwendet (CAS steht für Cloud Analytic Services). Dieses Mal werde ich vorstellen, wie nur einige Spalten extrahiert und die Informationen in CASTable angezeigt werden.
Stellen Sie zunächst eine Verbindung zu SAS Viya her.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Dann holen Sie sich die CASTable. Dieses Mal werde ich CSV von IRIS-Daten verwenden.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Sie können die Spalte abrufen, indem Sie den Schlüssel mit tbl als Diktat angeben.
col = tbl['sepal_width']
col
Die Ausgabe sieht folgendermaßen aus:
CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
Wenn Sie die "head" -Methode einer Spalte verwenden, wird nur der Wert dieser Spalte ausgegeben.
col.head()
0 3.8
1 2.6
2 2.8
3 3.0
4 3.8
Name: sepal_width, dtype: float64
Wenn Sie den Schlüssel als Array angeben, können Sie ebenfalls mehrere Spalten abrufen.
widths = tbl[['sepal_width', 'petal_width', 'species']]
Der Inhalt ist wie folgt.
sepal_width | petal_width | species | |
---|---|---|---|
0 | 3.8 | 2.0 | virginica |
1 | 2.6 | 2.3 | virginica |
2 | 2.8 | 2.0 | virginica |
3 | 3.0 | 2.3 | virginica |
4 | 3.8 | 2.2 | virginica |
Sie können auch die Zusammenfassung der Daten überprüfen.
widths.describe()
sepal_width | petal_width | |
---|---|---|
count | 150.000000 | 150.000000 |
mean | 3.054000 | 1.198667 |
std | 0.433594 | 0.763161 |
min | 2.000000 | 0.100000 |
25% | 2.800000 | 0.300000 |
50% | 3.000000 | 1.300000 |
75% | 3.300000 | 1.800000 |
max | 4.400000 | 2.500000 |
Die Spalteninformationen werden auf die gleiche Weise angezeigt.
widths.columninfo()
Column | ID | Type | RawLength | FormattedLength | NFL | NFD | |
---|---|---|---|---|---|---|---|
0 | sepal_width | 2 | double | 8 | 12 | 0 | 0 |
1 | petal_width | 4 | double | 8 | 12 | 0 | 0 |
2 | species | 5 | varchar | 10 | 10 | 0 | 0 |
Wenn Sie einige Spalten erhalten, können Sie die Analyse auf die erforderlichen Spalten eingrenzen, auch wenn die Tabelle viele Spalten enthält. Es kann verwendet werden, wenn zu viele numerische Daten vorhanden sind und Sie nicht wissen, wo Sie die Analyse durchführen sollen.
Recommended Posts