Verstehen Sie, warum Sie mit linearer Regression Hypothesen aufstellen Machen Sie eine Linie der Hypothese Verstehen Sie die Kostenfunktion, mit der Hypothesen identifiziert werden können, die der richtigen Antwort nahe kommen
der Begriff | Erläuterung |
---|---|
Linear Regression | Lineare Regression |
Hypothesis | Hypothese |
der Begriff | Erläuterung |
---|---|
H(x) | Hypothese |
Wx | Geneigt(W (Ist es eine unklare Verzerrung?)) |
b | Abweichung(bias) |
Der Einfachheit halber haben wir die folgenden Trainingsdaten vorbereitet.
x | y |
---|---|
1 | 1 |
2 | 2 |
3 | 3 |
Dies wird linear wie folgt ausgedrückt.
Es gibt viele solche linearen und vorhersehbaren Dinge auf der Welt. Zum Beispiel:
Wenn Sie die Miete eines Hauses schätzen möchten (je größer das Haus, desto höher die Miete) Wenn Sie Ihre Prüfungsnoten vorhersagen möchten (je mehr Zeit Sie zum Lernen geben, desto höher sind Ihre Noten).
Und so weiter.
Machen wir eine Linie, um eine Hypothese zu erstellen Trainingsdaten x und beliebige Daten Machen Sie es durch Hinzufügen von W und b.
Schreiben Sie in die Formel wie folgt.
Die folgende Abbildung ist eine lineare Version von drei Hypothesen.
Weil die Trainingsdaten x = 1, y = 1, x = 2, y = 2, x = 3, y = 3 sind Sie können sehen, dass die blaue Linie für die Trainingsdaten gilt. (Es gibt nur drei Hypothesen) Aber wir brauchen einen Weg, es mathematisch zu finden, damit es vom Computer verstanden werden kann.
Daher verwenden wir eine sogenannte Kostenfunktion.
Grob gesagt, Kostenfunktion Es ist der Standabstand (y) der "hypothetischen Linie" und der "richtigen Linie" zu vergleichen und festzustellen, dass die Linie umso korrekter ist, je kürzer der Abstand ist.
Vergleichen Sie die Standabstände wie in der folgenden Abbildung gezeigt.
"Linie durch Hypothese gemacht" - "Stehabstand (y)" Die Formel, die ich gerade gesagt habe, lautet wie folgt.
Damit jedoch Wenn y größer als die hypothetische Linie ist Es wird negativ sein, also quadrieren Sie es.
Das Anwenden dieser Formel auf diese Trainingsdaten ergibt:
Die Trainingsdaten sind drei, also habe ich sie durch drei geteilt.
Um es als Ausdruck auszudrücken, der für Millionen von Trainingsdaten verwendet werden kann, drücken Sie es wie folgt aus.
Wo H ist Es war das Ergebnis von Ich denke, es kann wie folgt ausgedrückt werden.
Je kleiner der Kostenwert (W, b) ist, desto näher kann die korrekte Hypothese identifiziert werden. Daher wird es wie folgt ausgedrückt.
Machen Sie eine hypothetische Linie mit Trainingsdaten und beliebigen W, b-Werten Je kleiner der Kostenwert (W, b) ist, desto näher an der richtigen Linie
Recommended Posts