SAS Viya ist eine KI-Plattform. Es ist in Sprachen wie Python, Java und R verfügbar. In SAS Viya wird ein Tabellenobjekt namens CASTable verwendet (CAS steht für Cloud Analytic Services). Dieses Mal werde ich erklären, wie Daten durch Angabe einer Spalte mit loc / iloc / ix in CASTable abgerufen werden.
Stellen Sie zunächst eine Verbindung zu SAS Viya her.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Dann holen Sie sich die CASTable. Dieses Mal werde ich CSV von IRIS-Daten verwenden.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Verwenden Sie loc, um die Spalte anzugeben, und geben Sie den Spaltennamen im zweiten Argument an.
tbl.loc[:, 'petal_width'].head()
Dann können Sie nur den Wert der angegebenen Spalte abrufen.
0 2.0
1 2.3
2 2.0
3 2.3
4 2.2
Name: petal_width, dtype: float64
Dies kann in mehreren Spalten angegeben werden.
tbl.loc[:, 'sepal_length':'petal_length'].head()
Bei mehreren Spalten wird die Kopfzeile angezeigt. Da dies durch den Bereich angegeben wird, wird auch die zwischen ihnen vorhandene sepal_width angezeigt.
sepal_length | sepal_width | petal_length | |
---|---|---|---|
0 | 7.9 | 3.8 | 6.4 |
1 | 7.7 | 2.6 | 6.9 |
2 | 7.7 | 2.8 | 6.7 |
3 | 7.7 | 3.0 | 6.1 |
4 | 7.7 | 3.8 | 6.7 |
Wenn Sie die Spalte angeben möchten, geben Sie sie als Array an.
tbl.loc[:, ['petal_width', 'sepal_width']].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Sie können anstelle eines Spaltennamens eine Nummer angeben.
tbl.loc[:, 3].head()
0 2.0
1 2.3
2 2.0
3 2.3
4 2.2
Name: petal_width, dtype: float64
Gleiches gilt für mehrere Spaltenspezifikationen.
tbl.iloc[:, 0:3].head()
sepal_length | sepal_width | petal_length | |
---|---|---|---|
0 | 7.9 | 3.8 | 6.4 |
1 | 7.7 | 2.6 | 6.9 |
2 | 7.7 | 2.8 | 6.7 |
3 | 7.7 | 3.0 | 6.1 |
4 | 7.7 | 3.8 | 6.7 |
Wenn Sie eine Spalte angeben, gilt dies auch für ein Array.
tbl.iloc[:, [3, 1]].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Eine Kombination von Zahlen und Spaltennamen ist ebenfalls möglich.
tbl.ix[:, [3, 'sepal_width']].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Es gibt viele Situationen, in denen Sie nur einige Daten analysieren möchten. Verwenden Sie in einem solchen Fall loc, iloc oder ix, um die Daten schnell zu extrahieren. Zahlen sind auch einfach zum Schleifen zu verwenden, daher sollten sie auch zur Automatisierung von Analyse und Berechnung nützlich sein.
Recommended Posts