Fortsetzung der vorherigen Sitzung.

Eine Erinnerung an die erste Hälfte von Kapitel 2 des Buches Maschinelles Lernen ab Python. Ich denke, dieser Artikel ist ein Chaos, es sei denn, Sie lesen "Maschinelles Lernen ab Python". Lass es uns kaufen und zusammen lernen!

Mit einem Lehrer lernen

Wenn Sie etwas lernen, müssen Sie zuerst die in dieser Studie oder diesem Bereich verwendete Sprache lernen, bevor Sie sprechen oder diskutieren können. Als Anfänger kann ich nicht auf diese Straße kommen, ohne zuerst Stück für Stück auf diese große Mauer zu klettern. Es ist etwas kompliziert, aber ich werde gleichzeitig die Worte erklären, die ich zum ersten Mal höre.

Klassifikation und Regression

Maschinelles Lernen mit einem Lehrer kann grob unterteilt werden ・ Klassenklassifizierung · Rückkehr Kann klassifiziert werden (dies ist eine Klassifizierung).

Die in Kapitel 1 vorgenommene Klassifizierung der Iris und die Beurteilung von SPAM-E-Mails werden ebenfalls klassifiziert.

Andererseits bezieht sich Regression auf maschinelles Lernen, das eine kontinuierliche Wertvorhersage durchführt. Zum Beispiel · Ertrag ・ Jährliche Einkommensprognose ・ Schwankung des Aktienkurses Oder so.

Verallgemeinerung, Überanpassung, Unteranpassung

Das Ziel des maschinellen Lernens ist die Verallgemeinerung. Wenn das aus den Trainingsdaten erstellte Vorhersagemodell unbekannte Daten genau vorhersagen kann, wird das Modell als verallgemeinert bezeichnet. Ich denke, es ist okay, wenn sich das Modell gut anfühlt.

Das Erstellen eines Modells, das mehr Informationen als nötig liefert, wird als Überanpassung bezeichnet. Das Gegenteil heißt mangelnde Konformität. Wenn die Informationsmenge aufgrund unzureichender Konformität erhöht wird, nimmt die Genauigkeit allmählich zu. Wenn die Informationsmenge jedoch eine bestimmte Menge überschreitet, wird sie überkonform und nimmt ab. Dies ist das Modell, das von dem Modell benötigt wird, das den Sweet Spot (Maximalwert der Genauigkeit) liefert, der die beste Generalisierungsleistung zeigt.

Überwachter Algorithmus für maschinelles Lernen

Warnungstext

# Datensatzgenerierung
X, y = mglearn.datasets.make_forge()

In diesem Moment

DeprecationWarning: Function make_blobs is deprecated; Please import make_blobs directly from scikit-learn
  warnings.warn(msg, category=DeprecationWarning)

Eine Warnmeldung wird angezeigt, die ich jedoch vorerst ignorieren werde, da sie fortgesetzt wird. Danach werden bei Verwendung von mglearn viele Warnungstexte angezeigt, die jedoch alle ignoriert werden.

Wisconsin University

Universität von Wisconsin Es ist eine ausgezeichnete Schule, die in der Weltrangliste der Universitäten aufgeführt ist und Nobelpreisträger hervorgebracht hat. Wenn Sie dieses Buch lesen, können Sie möglicherweise Freunde an der Wisconsin University finden. "Ah, dieser Wisconsin-Typ" "Oh ja, der mit Brustkrebs!" Es ist wie es ist.

Zip-Funktion

Verwendung von Python- und Zip-Funktionen: Mehrere Listenelemente gleichzeitig abrufen Hier erfahren Sie, wie Sie die Zip-Funktion verwenden.

Feature Quantity Engineering

Das Produkt zwischen Merkmalsgrößen wird als Interaktion bezeichnet.

k-nächste Methode

k-Klassifizierung des nächsten Nachbarn

Eine Methode zur Entscheidung eines Etiketts durch Abstimmung (Mehrheitsentscheidung) unter Bezugnahme auf die k nächsten Daten. Da es aufgrund der Entfernung zum Kontext kein Gewicht gibt, ist es möglich, dass sich das Etikett vom nächstgelegenen unterscheidet. Die Grenze der Klasse kann durch Ändern der beiden Merkmalsgrößen bestimmt werden. Diese Kirche wird als Entscheidungsgrenze bezeichnet. Je größer der Wert von k ist, desto glatter ist die Entscheidungsgrenze, und je kleiner der Wert von k ist, desto komplexer kann das Modell unterstützt werden. In dem Buch wurde die Anzahl von k geändert, um die Anzahl von Referenzen mit der höchsten Genauigkeit zu finden.

k-nahe Regression

k-Rückgabeversion der nächsten Methode. Dies ist eine Methode, um den Wert des nächsten zu übernehmen, wenn k = 1 ist, und den Durchschnittswert, wenn er 3 oder 9 ist. Ich denke, es ist der einfachste Weg, den man sich vorstellen kann.

Vorteile und Nachteile

Vorteile: Leicht zu verstehen, ziemlich hohe Genauigkeit ohne Anpassung Nachteile: Größere Trainingssätze verlangsamen sich, spärliche Datensätze weisen eine schlechte Leistung auf Aus diesem Grund wird es in der Praxis selten eingesetzt.

Lineares Modell

Lineare Regression

Es ist die Methode der kleinsten Quadrate. Eine Methode zum Übernehmen eines Parameters, der den Fehler im Quadrat minimiert.

Ridge kehrt zurück

Plötzlich wurde es unklar. Es gibt zu wenig Erklärung für die L2-Regularisierung. .. .. Überlernen und L2-Regularisierung Wenn Sie diese Seite überprüfen, ist es möglicherweise einfacher, sich das vorzustellen. Zusamenfassend, "Tilt" w Um nicht nur Vorhersagen für Trainingsdaten, sondern auch andere Einschränkungen zu optimieren (← Ich bin mir hier nicht sicher) Ich möchte, dass w kleiner ist als die Anpassung an die Trainingsdaten (Ergebnisse, die mit der Methode der kleinsten Quadrate erhalten wurden). Daher wird die Größe von w mit einer Strafe für die Summe der Quadrate belegt, um sie absichtlich kleiner zu machen.

Je kleiner die Strafe, desto näher ist sie einem linearen Modell. Wenn die Strafe groß ist, nähert sich w 0. Mit anderen Worten, wenn Sie verallgemeinern möchten, können Sie die Strafe erhöhen, aber wie viel Sie erhöhen sollten, hängt vom Modell ab.

Jep. Ich weiß nicht, wie ich es selbst sagen soll.

Lasso Dies ist eine Strafe für die Summe der absoluten Werte, aber zu diesem Zeitpunkt scheint der Koeffizient tendenziell 0 zu sein. Es wurde geschrieben, um verwendet zu werden, wenn Sie Variablen reduzieren möchten. Ich bin mir nicht sicher, also werde ich es im Detail untersuchen und einen Artikel schreiben.

Lineares Modell zur Klassifizierung

Das lineare Modell klassifiziert bei der Klassifizierung danach, ob der Wert der Funktion größer oder kleiner als 0 ist. Die logistische Regression ist in der Regression enthalten, scheint jedoch ein Klassifizierungsalgorithmus zu sein. Der Unterschied zwischen linearer SVC und logistischer Regression war nicht klar.

Mehrklassenklassifizierung nach linearem Modell

Ein Eins-zu-Andere-Ansatz (Eins-gegen-Ruhe) wurde erklärt. Es wird klassifiziert, indem es in eine Klasse und die andere klassifiziert wird und für alle Klassen durchgeführt wird. Ich verstehe, was Sie sagen, aber am Ende scheint es, dass Sie nur Scicit-Learn verwenden und Ihr Verständnis nicht vertiefen. .. .. Ich weiß, wie man es benutzt, also denke ich, dass ich mich daran gewöhnen kann.

Maschinelles Lernen beginnend mit Python Personal Memorandum Part2