[PYTHON] Zeigen und analysieren Sie nur einige Spalten in CASTable

SAS Viya ist eine KI-Plattform. Es ist in Sprachen wie Python, Java und R verfügbar. In SAS Viya wird ein Tabellenobjekt namens CASTable verwendet (CAS steht für Cloud Analytic Services). Dieses Mal werde ich vorstellen, wie nur einige Spalten extrahiert und die Informationen in CASTable angezeigt werden.

Holen Sie sich eine Tabelle aus der Datenbank

Stellen Sie zunächst eine Verbindung zu SAS Viya her.

import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')

Dann holen Sie sich die CASTable. Dieses Mal werde ich CSV von IRIS-Daten verwenden.

tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable

Holen Sie sich die Spalte

Sie können die Spalte abrufen, indem Sie den Schlüssel mit tbl als Diktat angeben.

col = tbl['sepal_width']
col

Die Ausgabe sieht folgendermaßen aus:

CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])

Daten anzeigen

Wenn Sie die "head" -Methode einer Spalte verwenden, wird nur der Wert dieser Spalte ausgegeben.

col.head()
0    3.8
1    2.6
2    2.8
3    3.0
4    3.8
Name: sepal_width, dtype: float64

Holen Sie sich mehrere Spalten

Wenn Sie den Schlüssel als Array angeben, können Sie ebenfalls mehrere Spalten abrufen.

widths = tbl[['sepal_width', 'petal_width', 'species']]

Der Inhalt ist wie folgt.

sepal_width petal_width species
0 3.8 2.0 virginica
1 2.6 2.3 virginica
2 2.8 2.0 virginica
3 3.0 2.3 virginica
4 3.8 2.2 virginica

Sie können auch die Zusammenfassung der Daten überprüfen.

widths.describe()
sepal_width petal_width
count 150.000000 150.000000
mean 3.054000 1.198667
std 0.433594 0.763161
min 2.000000 0.100000
25% 2.800000 0.300000
50% 3.000000 1.300000
75% 3.300000 1.800000
max 4.400000 2.500000

Die Spalteninformationen werden auf die gleiche Weise angezeigt.

widths.columninfo()
Column ID Type RawLength FormattedLength NFL NFD
0 sepal_width 2 double 8 12 0 0
1 petal_width 4 double 8 12 0 0
2 species 5 varchar 10 10 0 0

Zusammenfassung

Wenn Sie einige Spalten erhalten, können Sie die Analyse auf die erforderlichen Spalten eingrenzen, auch wenn die Tabelle viele Spalten enthält. Es kann verwendet werden, wenn zu viele numerische Daten vorhanden sind und Sie nicht wissen, wo Sie die Analyse durchführen sollen.

SAS for Developers | SAS

Recommended Posts

Zeigen und analysieren Sie nur einige Spalten in CASTable
Verwendung berechneter Spalten in CASTable
[Python] Vertauschen von Zeilen und Spalten mit Numpy-Daten
Anzeigen von Seriennummernspalten und -variablen mit der Flaschenvorlage
Lesen Sie die CSV-Datei und zeigen Sie sie im Browser an