[PYTHON] Datenanalyse Titanic 3

Aidemy 2020/10/31

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur AI-spezialisierten Schule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der dritte Beitrag von "Data Analysis Titanic". Freut mich, dich kennenzulernen.

Was diesmal zu lernen ・ ⑤ Problemmodellierung, Vorhersage und Lösung

Modell erstellen

Auswahl des zu verwendenden Algorithmus

Datenaufbereitung

・ Code![Screenshot 2020-10-24 18.32.01.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/57f40d79-e73c-3912- e3be-ea8389d5e6fb.png)

Logistische Rückgabe

・ (Überprüfung) __Logistische Regression __ verwendet die Sigmoidfunktion __, um Binärwerte zu klassifizieren. Die Sigmoid-Funktion ist eine Funktion __, die einen Wert zwischen __0 und 1 annimmt. Erstellen Sie ein Modell mit __LogidticRegression () __.

-Code (einschließlich Ergebnisse)![Screenshot 2020-10-24 19.03.30.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/79db1564 -18c1-c397-80b0-e236333cad58.png)

Visualisieren Sie, welche erklärenden Variablen (Merkmale) die Ergebnisse wahrscheinlich beeinflussen

-__ Um zu wissen, "welche erklärende Variable (Merkmalsmenge) das Ergebnis wahrscheinlich beeinflusst" _, berechnen Sie den __ partiellen Regressionskoeffizienten __ zwischen der Zielvariablen und der erklärenden Variablen. Man kann sagen, dass es umso einfacher ist, das Ergebnis zu beeinflussen, je größer der Wert ist. -Berechnen Sie den partiellen Regressionskoeffizienten mit __ "model.corf" __. Da ich es in DataFrame behandeln möchte, erstelle ich einen DataFrame mit Spalten von train_df in der Zeile ("Feature"), erstelle einen "partiellen Regressionskoeffizienten" als neue Spalte und speichere dort den partiellen Regressionskoeffizienten.

・ Code![Screenshot 2020-10-24 19.25.54.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/1cd46828-9fcd-bec9- 0851-275745c732b3.png)

・ Ergebnis![Screenshot 2020-10-24 19.26.25.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/efd82e96-a574-36ea- 80ac-2bc177a5ed6f.png)

SVM

・ Code (Wenn Sie LinearSVC auf die gleiche Weise erstellen, ist dies in Ordnung. Dieses Ergebnis ist "83,84".) スクリーンショット 2020-10-24 19.48.48.png

k-NN

・ Code![Screenshot 2020-10-24 19.56.44.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/04b20121-5e79-cf72- 9d79-4d5c9ce7018d.png)

Entscheidungsbaum

Zufälliger Wald

Modellbewertung

・ Code![Screenshot 2020-10-24 21.52.03.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/5140731d-b25a-73c6- 2b77-0780d617f121.png)

・ Ergebnis![Screenshot 2020-10-24 22.10.51.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/c7ac0fac-5ba4-f9e3- 3939-cc0a12fe92c1.png)

Modell speichern

・ Code (Dateipfad ist fiktiv) スクリーンショット 2020-10-24 22.24.47.png

Zusammenfassung

Diese Zeit ist vorbei. Vielen Dank für das Lesen bis zum Ende.

Recommended Posts

Datenanalyse Titanic 1
Datenanalyse Titanic 3
Datenanalyse Python
Datenanalyse vor der Erzeugung der Titanic-Features von Kaggle
Datenanalyse mit Python 2
Datenanalyse mit xarray
Datenanalyse mit Python
Ich habe versucht, die Hauptkomponenten mit Titanic-Daten zu analysieren!
Mein Python-Datenanalyse-Container
Mehrdimensionale Datenanalysebibliothek xarray
Python für die Datenanalyse Kapitel 4
[Python] Hinweise zur Datenanalyse
Lernnotizen zur Python-Datenanalyse
Python für die Datenanalyse Kapitel 2
Wrap-Analyse Teil1 (Datenaufbereitung)
Datenanalyse mit Python-Pandas
Tipps und Vorsichtsmaßnahmen bei der Datenanalyse
Python für die Datenanalyse Kapitel 3
Twitter-Daten analysieren | Trendanalyse
Lassen Sie uns die Analyse der sinkenden Daten der Titanic so durchführen
Erste Satellitendatenanalyse von Tellus
Datenvorhersagewettbewerb in 3 Schritten (titanisch)
Vorverarbeitungsvorlage für die Datenanalyse (Python)
November 2020 Version Datenanalyse Test bestanden Erfahrung
Datenanalyse zur Verbesserung von POG 3 ~ Regressionsanalyse ~
Empfehlung zur Datenanalyse mit MessagePack
Zeitreihenanalyse 3 Vorverarbeitung von Zeitreihendaten
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Datenverarbeitung 2 Analyse verschiedener Datenformate
Mehrdimensionale Datenanalysebibliothek xarray Teil 2
Visualisierung und Analyse von Stava Twitter-Datenstandortinformationen
Python-Visualisierungstool für die Datenanalyse
Überprüfen Sie die Rohdaten mit Kaggles Titanic (kaggle ⑥)
Datenanalyse, was machen Sie denn?
Datenverarbeitung
[Python] Erste Datenanalyse / maschinelles Lernen (Kaggle)
Erstellen einer Datenanalyseanwendung mit Streamlit
Parabolische Analyse
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
[Datenanalyse] Lassen Sie uns die US-Automobilbestände analysieren
Ich habe ein Python-Datenanalysetraining aus der Ferne durchgeführt
Datenanalyseumgebung mit Schwerpunkt auf Datalab (+ GCP)
Vorbereitung auf die von Python 3 Engineer zertifizierte Datenanalyseprüfung
Vorverarbeitung beim maschinellen Lernen 1 Datenanalyseprozess
JupyterLab Grundeinstellung 2 für die Datenanalyse (pip)
JupyterLab Basic Setup für die Datenanalyse (pip)
Datenanalyse zur Verbesserung von POG 2 ~ Analyse mit Jupiter-Notebook ~
Bereiten Sie eine Programmiersprachenumgebung für die Datenanalyse vor
[CovsirPhy] COVID-19 Python-Paket für die Datenanalyse: Laden von Daten
Python 3 Engineer Zertifizierungsdatenanalyse Prüfung Pre-Exam Learning
Eine Einführung in die statistische Modellierung für die Datenanalyse
[Python] Datenanalyse, maschinelles Lernen (Kaggle) -Datenvorverarbeitung-
Verwendung von Datenanalysetools für Anfänger
Datenanalyse in Python: Ein Hinweis zu line_profiler
[Einführung zur Minimierung] Datenanalyse mit SEIR-Modell ♬