Maschinelles Lernen ML, Statistik, Datenwissenschaft. All dies sind Wörter, die wir aufgrund der raschen Verbreitung der KI in den letzten Jahren oft hören, aber was ist der Unterschied zwischen ihnen? Es gibt keine eindeutige Antwort, aber um es einfach auszudrücken: Data Science ist ein Bereich, der spezielle Bereiche wie Statistik, Informatik und Wirtschaft kombiniert. Es wird leichter zu verstehen sein, wenn Sie sich die folgende Abbildung ansehen. Derzeit sind Datenwissenschaftler in verschiedenen Bereichen tätig, und ihre Akzeptanz nimmt in verschiedenen Unternehmen zu, von Versicherungsunternehmen über Personalunternehmen bis hin zu Beratungsunternehmen. Alle Bereiche sind insofern gemeinsam, als sie anhand von Daten und Fachwissen analysieren und die Analyseergebnisse erläutern. Andererseits kann maschinelles Lernen als Schnittpunkt von Statistik und Informatik in der Datenwissenschaft betrachtet werden. Die Punkte der Lösung von Problemen mit ** Daten in Statistiken und der Lösung von Problemen mit ** Algorithmen in der Informatik gelten auch für maschinelles Lernen. Auf der anderen Seite konzentriert sich maschinelles Lernen darauf, wie gut die Ergebnisse zutreffen, während sich die Statistik auf die mathematische Korrektheit konzentriert und die Informatik darauf, wie schnell und genau sie verarbeitet wird. Ich werde mich hauptsächlich darauf konzentrieren, ob dies möglich ist **.
Methoden des maschinellen Lernens können grob in drei Typen unterteilt werden: "überwachtes Lernen", "unbeaufsichtigtes Lernen" und "verbessertes Lernen". Sowohl "überwachtes Lernen" als auch "unbeaufsichtigtes Lernen" haben gemeinsam, dass sie bestimmte Daten auf einer Maschine trainieren, um eine Ausgabe zu erhalten. Andererseits werden beim "überwachten Lernen" ** die angegebenen Daten von einem Etikett begleitet, das angibt, ob die Antwort vom Menschen im Voraus richtig ist ** oder nicht, während beim "unbeaufsichtigten Lernen" ** die angegebenen Daten angegeben sind Da es keine Informationen darüber enthält, ob die Antwort richtig ist oder nicht **, ist die von der Maschine festgelegte Klassifizierung die endgültige Ausgabe. Bei "Stärkung des Lernens" wird die Ausgabe, die aus den Eingabedaten ausgegeben wird, bewertet (belohnt), und das Lernen wird entsprechend fortgesetzt. "Stärkung des Lernens" hat relativ begrenzte Anwendungen wie Laufroboter und Shogi-Spiele. Überwachtes / unbeaufsichtigtes Lernen wird weiter unterteilt in "Klassifizierungsprobleme" und "Rückkehrprobleme". Bei dem "Klassifizierungsproblem" wird das Klassifizierungsergebnis von 1 oder 0 als Ausgabe ausgegeben, während bei dem "Regressionsproblem" kontinuierliche numerische Daten als Ausgabe ausgegeben werden. Es gibt verschiedene Modelle zur Berechnung von Ausgabedaten aus Eingabedaten.
Recommended Posts