[PYTHON] Prädiktive Statistik (Theorie)

Bitte zögern Sie nicht zu kommentieren, da es als Ergebnis der Studie falsch sein kann. Dieses Mal werde ich über Vorhersagen schreiben.

Inhalt

・ Was ist Vorhersage? ・ Variablentyp ・ Vorhersagemethode ・ Über Daten

Was ist vorherzusagen?

Es ist vorherzusagen, ob das Diagramm nach einer bestimmten Zeit von den Informationen des Diagramms vor einer bestimmten Zeit ansteigt oder abfällt, oder vorherzusagen, wie es mit einer bestimmten Bezeichnung klassifiziert werden soll.

Variable

Bei der Vorhersage werden zwei Hauptvariablen verwendet. ・ Zielvariable ・ Erklärende Variablen

Objektive Variable

Die Zielvariable ist das Ziel der zu verarbeitenden Daten. Bei der Betrachtung des Produktverkaufs ist beispielsweise die Anzahl der Produkte selbst die Zielvariable.

Erklärende Variable

Erklärende Variablen sind Ereignisse, die sich auf die Zielvariable auswirken. Beispielsweise können die Apfelverkäufe aufgrund des Wetters, der Verbrauchernachfrage und moderner sozialer Probleme sinken oder steigen. Erklärende Variablen sind diese Ereignisse.

Vorhersagemethode

Es gibt die folgenden zwei Methoden, um Vorhersagen zu treffen. · Rückkehr ・ Klassifizierung

Rückkehr

Dies macht eine Graphvorhersage für numerische Werte. Zum Beispiel die Nachfrageprognose für die im vorherigen Beispiel genannten Produkte.

Einstufung

Dies ist eine Methode zum Teilen nach Kategorien. Zum Beispiel sagen wir voraus, dass wir Löwen und Geparden in die Kategorie der Katzen einteilen werden.

Über Daten

Daten werden häufig täglich verwendet, sind jedoch in der Welt der Datenwissenschaft gut strukturiert. Dies sind die folgenden zwei. · Ausbildung ・ Bewertung (Test)

Lernen

Erstellen eines Modells basierend auf den Daten

Auswertung

Vergleich des erlernten Modells mit den ursprünglichen Bewertungsdaten

* Notizen </ b> Eine Sache, die Sie beim Erstellen eines Modells beachten sollten, ist, Übertraining </ b> zu vermeiden. Übertraining bedeutet, dass Sie nicht flexibel vorhersagen können, weil Sie zu viele spezifische Daten eingegeben haben. Wenn Sie beispielsweise Daten eingeben, dass jeder in einer Cram-Schule mit 100 Schülern Äpfel liebt, sagt die Maschine voraus, dass auch andere Menschen Äpfel mit einer 100% igen Chance lieben werden. In einer anderen Schule lieben jedoch nur die Hälfte oder weniger der Schüler Äpfel. Zu diesem Zeitpunkt ist die Vorhersage nicht 100%. Das ist Überlernen. Daher muss die Datenmenge, die gelernt werden muss, um dies zu vermeiden, angepasst werden.

Recommended Posts