[PYTHON] Überprüfen Sie die Datenzusammenfassung in CASTable

SAS Viya ist eine KI-Plattform. Es ist in Sprachen wie Python, Java und R verfügbar. In SAS Viya wird ein Tabellenobjekt namens CASTable verwendet (CAS steht für Cloud Analytic Services). Dieses Mal werde ich vorstellen, wie Sie die Extraktionsbedingungen ändern, wenn Sie den Datenstatus in CASTable anzeigen.

Holen Sie sich eine Tabelle aus der Datenbank

Stellen Sie zunächst eine Verbindung zu SAS Viya her.

import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')

Dann holen Sie sich die CASTable. Dieses Mal werde ich CSV von IRIS-Daten verwenden.

tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable

Überprüfen Sie die Informationen

Verwenden Sie die Methode "beschreiben", um zu sehen, über welche Daten Sie verfügen.

tbl.describe()

Das Ergebnis wird wie folgt zurückgegeben. Sie können die Anzahl der Zeilen, die Standardabweichung, den Minimalwert, den Maximalwert und Daten im Wert von 25% / 50% / 75% anzeigen.

sepal_length sepal_width petal_length petal_width
count 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667
std 0.828066 0.433594 1.764420
min 4.300000 2.000000 1.000000
25% 5.100000 2.800000 1.600000
50% 5.800000 3.000000 4.350000
75% 6.400000 3.300000 5.100000
max 7.900000 4.400000 6.900000

Prozentsatz ändern

Durch Ändern der Perzentile werden die abgerufenen Daten geändert. Das Folgende ist ein Beispiel für die Änderung von 30% und 80% Daten.

tbl.describe(percentiles=[0.3, 0.8])
sepal_length sepal_width petal_length petal_width
count 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667
std 0.828066 0.433594 1.764420
min 4.300000 2.000000 1.000000
30% 5.250000 2.800000 1.700000
50% 5.800000 3.000000 4.350000
80% 6.550000 3.400000 5.350000
max 7.900000 4.400000 6.900000

Das Ganze sehen

Geben Sie "include =" all "an, um alle Daten zu überprüfen.

tbl.describe(include='all')
sepal_length sepal_width petal_length petal_width species
count 150 150 150 150
unique 35 23 43 22
top 5 3 1.5 0.2
freq 10 26 14 28
mean 5.84333 3.054 3.75867 1.19867
std 0.828066 0.433594 1.76442 0.763161
min 4.3 2 1 0.1
25% 5.1 2.8 1.6 0.3
50% 5.8 3 4.35 1.3
75% 6.4 3.3 5.1 1.8
max 7.9 4.4 6.9 2.5

Die Zahl kann auch eine Gleitkommazahl sein.

tbl.describe(stats='all')
sepal_length sepal_width petal_length petal_width
count 1.500000e+02 1.500000e+02 1.500000e+02
unique 3.500000e+01 2.300000e+01 4.300000e+01
mean 5.843333e+00 3.054000e+00 3.758667e+00
std 8.280661e-01 4.335943e-01 1.764420e+00
min 4.300000e+00 2.000000e+00 1.000000e+00
25% 5.100000e+00 2.800000e+00 1.600000e+00
50% 5.800000e+00 3.000000e+00 4.350000e+00
75% 6.400000e+00 3.300000e+00 5.100000e+00
max 7.900000e+00 4.400000e+00 6.900000e+00
nmiss 0.000000e+00 0.000000e+00 0.000000e+00
sum 8.765000e+02 4.581000e+02 5.638000e+02
stderr 6.761132e-02 3.540283e-02 1.440643e-01
var 6.856935e-01 1.880040e-01 3.113179e+00
uss 5.223850e+03 1.427050e+03 2.583000e+03
cv 1.417113e+01 1.419759e+01 4.694272e+01
tvalue 8.642537e+01 8.626430e+01 2.609020e+01
probt 3.331256e-129 4.374977e-129 1.994305e-57

Zusammenfassung

Mit der Methode description können Sie sich einen Überblick über die Daten in der CASTable verschaffen. Bitte verwenden Sie es als Basis für die Datenanalyse.

SAS for Developers | SAS

Recommended Posts

Überprüfen Sie die Datenzusammenfassung in CASTable
Überprüfen Sie das Verhalten des Zerstörers in Python
Holen Sie sich die Spaltenliste und Datenliste von CASTable
Überprüfen Sie, ob die URL in Python vorhanden ist
Ich habe versucht, die verkratzten Daten in CSV zu speichern!
RSS-Daten in Zabbix speichern (externe Prüfung)
CASTable-Daten exportieren
Überprüfen Sie, ob die Zeichen in Python ähnlich sind
Die Geschichte des Lesens von HSPICE-Daten in Python
Überprüfen Sie den Status der Daten mit pandas_profiling
Überprüfen Sie, ob die Zeichenfolge eine Zahl in Python ist
Zusammenfassung der Tools, die zum Analysieren von Daten in Python benötigt werden
Überprüfen Sie, ob die erwartete Spalte in Pandas DataFrame vorhanden ist
Abtastung in unausgeglichenen Daten
Über die Ineffizienz der Datenübertragung im luigi on-memory
[Django] Tabelle abschneiden (alle Tabellendaten löschen)
Überprüfen Sie, ob es sich um Unix in der Skriptsprache handelt
Den Inhalt der Daten in Python nicht kennen
Verwenden wir die offenen Daten von "Mamebus" in Python
Überprüfen Sie, ob in Java BigQuery-Tabellen vorhanden sind
Versuchen Sie, die in Firefox gespeicherten Anmeldedaten zu entschlüsseln
Überprüfen Sie die atrophische Natur der Wahrscheinlichkeitsverteilung in Python
Zusammenfassung der von Pandas 2 häufig ausgeführten Prozesse (Datenreferenz, Bearbeitungsvorgang)
Versuchen Sie, COVID-19 Tokyo-Daten mit Python zu kratzen
[Python] So überprüfen Sie, ob der Schlüssel im Wörterbuch vorhanden ist
Testcode, um auf der Seite nach defekten Links zu suchen
[Pandas] Wenn sich die Daten der ersten Zeile im Header von DataFrame befinden
Verschiedene Methoden zur Berechnung der Ähnlichkeit zwischen Daten mit Python
Zusammenfassung der Stolperpunkte in Django zum ersten Mal
Den Typ mit Python beherrschen? (Wann ist eine Typprüfung durchzuführen?)
Überprüfen Sie im Voraus, was passiert, wenn der Befehl ausgeführt wird
[In kürzester Zeit verstehen] Python-Grundlagen für die Datenanalyse
[Homologie] Zählen Sie mit Python die Anzahl der Löcher in den Daten
Datenstrukturen vom Listentyp und ihre Operationen im Linux-Kernel
Aktivieren Sie die Schaltfläche Überprüfen in Tkinter, damit der Eintrag bearbeitet werden kann
Die minimale Methode, die beim Aggregieren von Daten mit Pandas zu beachten ist
Behandeln Sie Umgebungsdaten in Python
Zusammenfassung der Abfrage der Python-Fitbit-Datenerfassung
Finde Fehler in Python
Bearbeiten von Daten in Python-try mit Pandas_plyr
Zeigen Sie UTM-30LX-Daten in Python an
Gzip komprimiert Daten durch Streaming
Schreiben Sie Daten im HDF-Format
In der Liste verfügbare Methoden
Python-Datentyp-Zusammenfassungsnotiz
Überprüfen Sie den Code mit flake8
Zusammenfassung der Gesichtserkennung in Python
Tool-Tool zur Überprüfung regulärer Ausdrücke
Überprüfen Sie einfach den Inhaltstyp mit Flask (@content_type).
Was ist neu in Python 3.9 (Zusammenfassung)
[Python] Überprüfen Sie die installierten Bibliotheken
Überprüfen Sie, ob die Einstellungsdatei leicht verständlich gelesen wird
[Maschinelles Lernen] Überprüfen Sie die Leistung des Klassifikators anhand handgeschriebener Zeichendaten
Überprüfen Sie, ob der von PHP generierte Passwort-Hash in Python übereinstimmt
So überprüfen Sie die Speichergröße einer Variablen in Python
So überprüfen Sie die Speichergröße eines Wörterbuchs in Python
[TensorFlow 2] So überprüfen Sie den Inhalt von Tensor im Diagrammmodus
Überprüfen Sie das Zeichnungsergebnis mit Plotly, indem Sie CodePen in Qiita einbetten
[Golang] Überprüfen Sie, ob eine bestimmte Zeichenfolge in der Zeichenfolge enthalten ist