[In-Database Python Analysis-Lernprogramm mit SQL Server 2017] Schritt 2: Importieren Sie Daten mit PowerShell in SQL Server

Vom Anfang des Tutorials

In-Database Python Analysis für SQL-Entwickler

Vorheriger Schritt

Schritt 1: Beispieldaten herunterladen

Nächster Schritt

Schritt 3: Suchen und Visualisieren von Daten

Schritt 2: Importieren Sie Daten mit PowerShell in SQL Server

In diesem Schritt führen Sie das heruntergeladene Skript "RunSQL_SQL_Walkthrough.ps1" aus, um die für das Lernprogramm erforderlichen Datenbankobjekte zu erstellen und die Beispieldaten zu importieren.

Objekterstellung und Datenladen

Führen Sie das PowerShell-Skript "RunSQL_SQL_Walkthrough.ps1" in den heruntergeladenen Dateien aus, um die Lernprogrammumgebung vorzubereiten. Dieses Skript führt die folgenden Aktionen aus:

--Erstellen Sie eine Datenbank und eine Tabelle in der SQL Server-Instanz und laden Sie die Daten in großen Mengen.

--Erstellen Sie weitere Funktionen und gespeicherte Prozeduren.

Skript ausführen

  1. Öffnen Sie als Administrator eine PowerShell-Eingabeaufforderung und führen Sie den folgenden Befehl aus:

    .\RunSQL_SQL_Walkthrough.ps1
    

Sie werden aufgefordert, die folgenden Informationen einzugeben:

  1. Alle T-SQL-Skripte wurden geändert, um die im Rahmen der obigen Schritte angegebenen Datenbank- und Benutzernamen durch Platzhalter zu ersetzen.

  2. Stellen Sie sicher, dass die vom T-SQL-Skript erstellten gespeicherten Prozeduren und Funktionen in der Datenbank erstellt wurden.

    T-SQL-Skriptdatei Gespeicherte Prozedur / Funktion
    create-db-tb-upload-data.sql Erstellen Sie eine Datenbank und vier Tabellen.

    Tabellenyctaxi_sample:Der Hauptdatensatz von NYC Taxi wird erstellt. Die geladenen Daten sind eine 1% -Stichprobe des NYC Taxi-Datensatzes. Die Definition des Clustered Column Store Index verbessert die Speichereffizienz und die Abfrageleistung.

    Tabellenyc_taxi_models:Ein geschultes fortgeschrittenes analytisches Modell wird registriert.

    Tabellenyctaxi_sample_training:Der zum Trainieren des Modells verwendete Datensatz wird erstellt.

    Tabellenyctaxi_sample_testing:Der zum Testen des Modells verwendete Datensatz wird registriert.
    fnCalculateDistance.sql Skalarwertfunktion, die den direkten Abstand zwischen der Einstiegsposition und der Ausstiegsposition berechnetfnCalculateDistanceEin ... kreieren.
    fnEngineerFeatures.sql Eine tabellenwertige Funktion, die einen Feature-Wert zurückgibt, der für das Modelltraining festgelegt wurdefnEngineerFeaturesEin ... kreieren.
    TrainingTestingSplit.sql nyctaxi_Daten in der Probentabelle, Nyctaxi_sample_Training und Nyctaxi_sample_Verfahren zur Aufteilung in zwei TestbereicheTrainingTestingSplitEin ... kreieren.
    PredictTipSciKitPy.sql Scikit zur Vorhersage mit dem Modell-Vorgehensweise zum Aufrufen des trainierten Modells, das durch Lernen erstellt wurdePredictTipSciKitPyEin ... kreieren. Die Prozedur akzeptiert eine Abfrage als Eingabeparameter und gibt eine Zahlenspalte zurück, die die Punktzahl für die Eingabezeile enthält.
    PredictTipRxPy.sql Eine Prozedur, die ein trainiertes Modell aufruft, das mit RevoScalePy zur Vorhersage unter Verwendung des Modells erstellt wurdePredictTipRxPyEin ... kreieren. Die Prozedur akzeptiert eine Abfrage als Eingabeparameter und gibt eine Zahlenspalte zurück, die die Punktzahl für die Eingabezeile enthält.
    PredictTipSingleModeSciKitPy.sql Scikit zur Vorhersage mit dem Modell-Vorgehensweise zum Aufrufen des trainierten Modells, das durch Lernen erstellt wurdePredictTipSingleModeSciKitPyEin ... kreieren. Diese gespeicherte Prozedur verwendet neue Beobachtungen als Eingabe, akzeptiert einzelne Merkmalswerte als Inline-Parameter und gibt Vorhersagen für die neuen Beobachtungen zurück.
    PredictTipSingleModeRxPy.sql Scikit zur Vorhersage mit dem Modell-Vorgehensweise zum Aufrufen des trainierten Modells, das durch Lernen erstellt wurdePredictTipSingleModeRxPyEin ... kreieren. Diese gespeicherte Prozedur verwendet neue Beobachtungen als Eingabe, akzeptiert einzelne Merkmalswerte als Inline-Parameter und gibt Vorhersagen für die neuen Beobachtungen zurück.
    SerializePlots.sql Verfahren zum Abrufen von DatenSerializePlotsEin ... kreieren. Diese gespeicherte Prozedur verwendet Python, um Grafiken zu erstellen und Diagrammobjekte zu serialisieren.
    TrainTipPredictionModelSciKitPy.sql scikit-Verfahren zum Trainieren eines logistischen Regressionsmodells durch LernenTrainTipPredictionModelSciKitPyEin ... kreieren. Dieses Modell wird unter Verwendung von 60% der zufällig ausgewählten Daten trainiert, um den abgegriffenen Wert vorherzusagen (ob ein Chip erhalten werden soll oder nicht). Die Ausgabe der gespeicherten Prozedur ist ein trainiertes Modell, eine Tabellenyc_taxi_modelsWird in registriert.
    TrainTipPredictionModelRxPy.sql Verfahren zum Trainieren eines logistischen Regressionsmodells mit RevoScalePyTrainTipPredictionModelRxPyEin ... kreieren. Dieses Modell wird unter Verwendung von 60% der zufällig ausgewählten Daten trainiert, um den abgegriffenen Wert vorherzusagen (ob ein Chip erhalten werden soll oder nicht). Die Ausgabe der gespeicherten Prozedur ist ein trainiertes Modell, eine Tabellenyc_taxi_modelsWird in registriert.

    sqldev-python-browsetables1-gho9o9.png

    [!NOTE]

Das T-SQL-Skript erstellt das Datenbankobjekt nicht neu. Wenn es bereits vorhanden ist, werden die Daten dupliziert. Löschen Sie daher das vorhandene Objekt, bevor Sie das Skript erneut ausführen.

** Wichtig **: Einige Objekte neu definieren

Führen Sie nach dem Ausführen der obigen Schritte die folgende SQL aus, um einige Objekte neu zu definieren. ** Die Spezifikationen von RevoScalePy wurden beim Upgrade von SQL Server 2017 CTP auf SQL Server 2017 RC geändert. Der Hauptgrund für diese Neudefinition ist die Anpassung an diese Änderungen. ** ** **

Verknüpfung

Nächster Schritt

Schritt 3: Suchen und Visualisieren von Daten

Vorheriger Schritt

Schritt 1: Beispieldaten herunterladen

Vom Anfang des Tutorials

In-Database Python Analysis für SQL-Entwickler

Quelle

Step 2: Import Data to SQL Server using PowerShell

Verwandte Artikel

Machine Learning Services with Python

Recommended Posts

[In-Database Python Analysis-Lernprogramm mit SQL Server 2017] Schritt 2: Importieren Sie Daten mit PowerShell in SQL Server
[In-Database Python Analysis-Lernprogramm mit SQL Server 2017] Schritt 6: Verwenden des Modells
[In-Database Python Analysis Tutorial mit SQL Server 2017] Schritt 1: Laden Sie Beispieldaten herunter
[In-Database Python Analysis Tutorial mit SQL Server 2017]
[In-Database Python Analysis Tutorial mit SQL Server 2017] Schritt 5: Training und Speichern von Modellen mit T-SQL
Datenanalyse mit Python 2
Datenanalyse mit Python
Lesehinweis: Einführung in die Datenanalyse mit Python
[Technisches Buch] Einführung in die Datenanalyse mit Python -1 Kapitel Einführung-
ODBC-Zugriff auf SQL Server von Linux mit Python
Datenanalyse mit Python-Pandas
20200329_Einführung in die Datenanalyse mit Python 2nd Edition Personal Summary
Ich kenne? Datenanalyse mit Python oder Dingen, die Sie mit numpy verwenden möchten, wenn Sie möchten
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Einführung in die Datenanalyse mit Python P32-P43 [ch02 3.US Babynamen 1880-2010]
Einführung in die Datenanalyse mit Python P17-P26 [ch02 1.usa.gov Daten von bit.ly]
Links zu Personen, die gerade mit der Datenanalyse mit Python beginnen
Von der Vorbereitung der morphologischen Analyse mit Python unter Verwendung von Polyglot bis zur Teilwortmarkierung
Konvertieren Sie Excel-Daten mit Python in JSON
Empfehlungs-Tutorial mit Assoziationsanalyse (Python-Implementierung)
Verbinden Sie Ihre SQL Server-Datenbank mit Python mit Alibaba Cloud Function Compute
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Ich habe versucht, fMRI-Daten mit Python zu analysieren (Einführung in die Dekodierung von Gehirninformationen)
Konvertieren Sie CSV- und TsV-Daten in eine Matrix mit Python als Beispiel für MovieLens
Beachten Sie bei der Verwendung von PyQtGraph mit Python Pyside die Reihenfolge des Imports
ODBC-Verbindung zu FileMaker 11 Server Advanced mit Python 3
Ich habe versucht, CloudWatch-Daten mit Python abzurufen
[Python] Fluss vom Web-Scraping zur Datenanalyse
Schreiben Sie CSV-Daten mit AWS-Lambda + Python in AWS-S3
Ich habe eine Funktion zum Abrufen von Daten aus der Datenbank spaltenweise mithilfe von SQL mit SQLite3 von Python [SQLite3, SQL, Pandas] erstellt.
Datenanalyse Python
Erstellen Sie mit Streamlit schnell ein Python-Datenanalyse-Dashboard und stellen Sie es in AWS bereit
Datenanalyse zur Verbesserung von POG 1 ~ Web Scraping mit Python ~
Holen Sie sich Amazon RDS (PostgreSQL) -Daten mithilfe von SQL mit Pandas
[Für Anfänger] So studieren Sie den Python3-Datenanalysetest
So kratzen Sie Bilddaten von Flickr mit Python
Einfache Möglichkeit, mit Google Colab mit Python zu kratzen
Aufbau einer Datenanalyseumgebung mit Python (IPython Notebook + Pandas)
Fordern Sie die Hauptkomponentenanalyse von Textdaten mit Python heraus
Schreiben Sie Daten mit dem Python-Anforderungsmodul in KINTONE
Verarbeiten Sie CSV-Daten mit Python (Zählverarbeitung mit Pandas)
Hauptkomponentenanalyse mit Python von nim mit nimpy
Model.objects.extra muss berücksichtigt werden, bevor Raw SQL mit Django verwendet wird
Datenanalyse mit xarray
Datenanalyse Übersicht Python
Sprachanalyse mit Python
Python-Datenanalysevorlage
[Python-Tutorial] Datenstruktur
Importieren Sie tsv mit Python
Sprachanalyse mit Python
Lokaler Server mit Python
Ich möchte Daten mit Python analysieren können (Teil 3)
Bildschirm und geteilter Bildschirm mit Python- und SSH-Anmeldung am Remote-Server
Ich habe versucht, mit Python faker verschiedene "Dummy-Daten" zu erstellen
Erste Schritte mit Python3 # 3 Versuchen Sie erweiterte Berechnungen mit der import-Anweisung
Ich möchte Daten mit Python analysieren können (Teil 1)