Python: Vorverarbeitung beim maschinellen Lernen: Übersicht

Datenanalyseprozess und Vorverarbeitung

Datenanalyseprozess und Vorverarbeitung in CRISP-DM

Verstehen Sie zunächst den Gesamtfluss der Datenanalyse. Der Datenanalyseprozess umfasst die folgenden, die als Standardprozesse vorgeschlagen wurden.

In CRISP-DM (CRoss Industry Standard Process für Data Mining), das von Shearer et al. Wir befürworten den in der folgenden Abbildung gezeigten Prozess.

image.png

In diesem Prozess

(1) Klären Sie geschäftliche Probleme durch Geschäftsverständnis und planen Sie ein Datenanalyseprojekt. (2) Verstehen Sie die aktuellen Daten, indem Sie die Daten erfassen, indem Sie die Daten verstehen und bestätigen, dass die Daten zur Analyse bereit sind. (3) Formatieren Sie bei der Datenaufbereitung die Daten in das Format, das für die nachfolgende Modellierung erforderlich ist. (4) 5. Bewerten Sie die durch Modellierung erhaltenen Analyseergebnisse, und wenden Sie die Analyseergebnisse auf das Unternehmen an, wenn ausreichende Ergebnisse erzielt werden. Wie in der Abbildung gezeigt, sind diese Prozesse keine Einbahnstraßen, sondern wechseln je nach Bedarf zwischen den vorherigen und nächsten Prozessen hin und her.

Die Vorverarbeitung lernte hier

CRISP-In DM entspricht dies dem Datenverständnis und der Datenaufbereitung.

KDD wird im nächsten Abschnitt erläutert.

Datenanalyseprozess und Vorverarbeitung in KDD

Im Vergleich zu CRISP-DM, das das gesamte Datenanalyseprojekt im Geschäft berücksichtigt KDD (Knowledge Discovery in Databases) von Fayyad et al. Wir konzentrieren uns mehr auf den Datenanalyseteil. Das Diagramm des KDD-Prozesses ist wie folgt.

image.png

image.png

Recommended Posts

Python: Vorverarbeitung beim maschinellen Lernen: Übersicht
Python: Vorverarbeitung beim maschinellen Lernen: Datenkonvertierung
Vorverarbeitung beim maschinellen Lernen 2 Datenerfassung
Vorverarbeitung beim maschinellen Lernen 4 Datenkonvertierung
[Python] Techniken, die häufig beim maschinellen Lernen verwendet werden
[Python] Speichern von Lernergebnissen (Modellen) beim maschinellen Lernen
Vorverarbeitung beim maschinellen Lernen 1 Datenanalyseprozess
Mikrodienst mit Python (Übersicht)
[Python] Datenanalyse, maschinelles Lernen (Kaggle) -Datenvorverarbeitung-
Lassen Sie uns einen Teil des maschinellen Lernens mit Python berühren
Ich habe mit der maschinellen Vorverarbeitung von Python Data begonnen
Python: Vorverarbeitung beim maschinellen Lernen: Umgang mit fehlenden / Ausreißern / unausgeglichenen Daten
Japanische Vorverarbeitung für maschinelles Lernen
Maschinelles Lernen in Delemas (Praxis)
Python Machine Learning Programming> Schlüsselwörter
Wird in EDA für maschinelles Lernen verwendet
Beginnend mit maschinellem Python-Lernen
Erstellen Sie mit Python eine interaktive Umgebung für maschinelles Lernen
Tool MALSS (Anwendung), das maschinelles Lernen in Python unterstützt
Coursera-Herausforderungen beim maschinellen Lernen in Python: ex2 (Logistic Return)
Tool MALSS (Basic), das maschinelles Lernen in Python unterstützt
Coursera Machine Learning Challenge in Python: ex1 (lineare Regression)
Versuchen Sie, das Modell des maschinellen Lernens in das Python-Paket aufzunehmen
MALSS (Einführung), ein Tool, das maschinelles Lernen in Python unterstützt
Implementieren Sie das Stacking-Lernen in Python [Kaggle]
Das Ergebnis des maschinellen Lernens von Java-Ingenieuren mit Python www
Maschinelles Lernen mit Python (1) Gesamtklassifizierung
Zusammenfassung des maschinellen Lernens von Python-Anfängern
Automatisieren Sie Routineaufgaben beim maschinellen Lernen
In Python implementierte Widrow-Hoff-Lernregeln
Klassifikation und Regression beim maschinellen Lernen
Maschinelles Lernen
Vorverarbeitung beim maschinellen Lernen 3 Fehlende Wert- / Ausreißer- / Ungleichgewichtsdaten
Python lernen
Maschinelles Lernen in Delemas (Datenerfassung)
Coursera-Herausforderungen für maschinelles Lernen in Python: ex7-2 (Primäranalyse)
Implementierte Perceptron-Lernregeln in Python
Random Seed Research im maschinellen Lernen
"Scraping & maschinelles Lernen mit Python" Lernnotiz
Wie wäre es mit Anaconda zum Erstellen einer maschinellen Lernumgebung mit Python?
Coursera-Herausforderungen beim maschinellen Lernen in Python: ex5 (Anpassung der Regularisierungsparameter)
Python & Machine Learning Study Memo: Vorbereitung der Umgebung
Hinweise zur Python-Grammatik für maschinelles Lernen in PyQ
Verstärken Sie Bilder für maschinelles Lernen mit Python
Verwenden Sie die API-Gruppe A3RT für maschinelles Lernen aus Python
Maschinelles Lernen mit Python (2) Einfache Regressionsanalyse
Ich habe Python 3.5.1 installiert, um maschinelles Lernen zu studieren
Warum Python für maschinelles Lernen ausgewählt wird
"Python Machine Learning Programming" - Zusammenfassung (Jupyter)
[Shakyo] Begegnung mit Python zum maschinellen Lernen
[Python] Erste Datenanalyse / maschinelles Lernen (Kaggle)
[Python] Wenn ein Amateur mit dem maschinellen Lernen beginnt
[Python] Webanwendungsdesign für maschinelles Lernen
Erstellen einer Umgebung für Python und maschinelles Lernen (macOS)
Eine Einführung in Python für maschinelles Lernen
Python & Machine Learning Study Memo ③: Neuronales Netz
Python & maschinelles Lernen Lernnotiz Machine: Maschinelles Lernen durch Rückausbreitung
Python & Machine Learning Study Memo ⑥: Zahlenerkennung
Aufbau einer KI / maschinellen Lernumgebung mit Python
Coursera Machine Learning Challenge in Python: ex6 (Anpassen von SVM-Parametern)
Quadtree in Python --2