[PYTHON] Feature Engineering für maschinelles Lernen Beginnend mit dem 4. Google Colaboratory - Interacting Features

Einführung

Dieser Artikel erläutert die Interaktionsfunktionen. Dieser Artikel basiert hauptsächlich auf "Feature Quantity Engineering für maschinelles Lernen". Bitte probieren Sie es aus, wenn Sie werden.

Was ist eine Interaktionsmerkmalsmenge?

Es ist eine Methode zum Erstellen einer neuen Merkmalsmenge durch Multiplizieren mehrerer Merkmalsmengen. Von diesen wird die Kombination der beiden Merkmale als ** paarweise Interaktionsmerkmale ** bezeichnet. Wenn die Merkmalsmenge binär ist, handelt es sich um ein logisches Produkt. Wenn es beispielsweise Regionen und Altersgruppen als Merkmalsgrößen gibt, können durch Multiplikation der Regionen und Altersgruppen Informationen erhalten werden, die die objektive Variable "20 Jahre in Tokio leben" besser aus den Informationen "20 Jahre" und "in Tokio lebend" ausdrücken können. Sie können es erstellen.

Die Nachteile sind jedoch, dass die Lernkosten steigen und unnötige Funktionen erstellt werden. Dieser Anstieg der Lernkosten und das Problem unnötiger Merkmalsmengen können durch Ausführen einer Merkmalsmengenauswahl gelöst werden.

Angenommen, Sie haben die folgenden Feature-Daten.

image.png

Wenn die Menge der Interaktionsmerkmale für diese Daten erstellt wurde, wurde der folgende Datensatz erstellt.

image.png

Unten finden Sie Beispielcode, der die Interaktionsfunktionen tatsächlich implementiert.

import numpy as np
import pandas as pd
import sklearn.preprocessing as preproc

##Feste Zufallszahl
np.random.seed(100)

data_array1 = []
for i in range(1, 100):
  s = np.random.randint(0, i * 10, 10)
  data_array1.extend(s)


##Feste Zufallszahl
np.random.seed(20)

data_array2 = []
for i in range(1, 100):
  s = np.random.randint(0, i * 10, 10)
  data_array2.extend(s)

data = pd.DataFrame({'A': data_array1, 'B': data_array2})

##Menge der Interaktionsfunktionen
data2 = pd.DataFrame(preproc.PolynomialFeatures(include_bias=False).fit_transform(data))
## interaction_only=Wenn Sie den Wert auf True setzen, können Sie das Quadrat Ihres eigenen Werts ausschließen.
# data2 = preproc.PolynomialFeatures(include_bias=False, interaction_only=True).fit_transform(data)

Schließlich

Ich denke darüber nach, ein Video über IT auf YouTube zu veröffentlichen. Bitte abonnieren Sie den Kanal und geben Sie uns eine hohe Bewertung, da dies Sie motivieren wird, Youtube und Qiita zu aktualisieren. YouTube: https://www.youtube.com/channel/UCywlrxt0nEdJGYtDBPW-peg Twitter: https://twitter.com/tatelabo

Recommended Posts

Feature Engineering für maschinelles Lernen Beginnend mit dem 4. Google Colaboratory - Interacting Features
Feature Engineering für maschinelles Lernen ab Teil 3 Google Colaboratory-Scale
Einheit 5 Feature Engineering für die Auswahl maschineller Lernfunktionen
OpenCV-Funktionserkennung mit Google Colaboratory
[Shakyo] Begegnung mit Python zum maschinellen Lernen
Maschinelles Lernen mit Pytorch in Google Colab
Passen Sie die Fortschrittsanzeige während des Lernens mit tf.keras an (Gegenmaßnahmen gegen Zellüberlauf in Google Colaboratory)
Richten Sie die Anzahl der Stichproben zwischen Datenklassen für maschinelles Lernen mit Python aus
Maschinelles Lernen beginnend mit Python Personal Memorandum Part2
Maschinelles Lernen ab 0 für theoretische Physikstudenten # 1
Maschinelles Lernen beginnend mit Python Personal Memorandum Part1
[Python] Sammeln Sie Bilder mit Icrawler für maschinelles Lernen [1000 Blatt]
Maschinelles Lernen von Grund auf neu (maschinelles Lernen mit Kaggle)
Maschinelles Lernen ab 0 für theoretische Physikstudenten # 2
Der erste Schritt des maschinellen Lernens ~ Für diejenigen, die versuchen möchten, mit Python zu implementieren ~
[Python] Speichern Sie PDF von Google Colaboratory in Google Drive! -Lass uns Daten für maschinelles Lernen sammeln-
Lernnotizen für die Migrationsfunktion im Django-Framework (2)
Prognostizieren Sie das Geschlecht von Twitter-Nutzern durch maschinelles Lernen
Lernnotizen für die Migrationsfunktion im Django-Framework (3)
Feature Engineering für Finanzprognosen: Wie hoch ist der Feature-Betrag in der Finanzprognose?
Lernnotizen für die Migrationsfunktion im Django-Framework (1)
Zusammenfassung des grundlegenden Ablaufs des maschinellen Lernens mit Python
Aufzeichnung der ersten Herausforderung des maschinellen Lernens mit Keras
Lernen Sie mit "Google Colaboratory" ganz einfach 100 Sprachverarbeitungsklopfen 2020.
Für diejenigen, die mit TensorFlow2 maschinelles Lernen beginnen möchten
Für Sie, die beim Lernen mit maschinellem Lernen plötzlich auf das Protokoll schauen ~ Muskeltraining mit LightGBM ~