Hinterlassen Sie eine Notiz, um sich daran zu erinnern, was Sie in pyq gelernt haben
pandas
・ Wenn Sie ein Histogramm zeichnen, `plt.hist``
plt.hist(df[df["y"] == 1]["x"], label="men 16years old", bins=100, Bereich = (140, 187), Alpha = 0,3, Farbe = "Grün")
(df ist CSV-Daten)
plt.xlabel (" height [cm] ")
: Titel der x-Achse
plt.legend ();
: Datenbeschreibung anzeigen
・ Wenn Sie ein Streudiagramm zeichnen, klicken Sie auf "plt.scatter"
plt.scatter(men["height"], men["weight"], color="green")
Das erste Argument ist der Wert auf der horizontalen Achse in den Daten. Das zweite Argument ist der Wert auf der vertikalen Achse in den Daten.
・ Beim Zeichnen einer Streudiagrammmatrix
pd.plotting.scatter_matrix(df)
DataFrame
· Spaltenwerte extrahieren
Geben Sie den Spaltennamen als "df [[" Alkoholgehalt "," Dichte "]]" an
df.iloc (Zeile zum Abrufen, Spalte zum Abrufen)
Verwenden Sie df.iloc
・ Teilen Sie die Daten für Training und Bewertung (Test)
Verwenden Sie train_test_split
from sklearn.model_selection import train_test_split (X_train, X_test, y_train, y_test) = train_test_split( X, y, test_size=0.3, random_state=0 )
test_size = 0.3 gibt an, wie viel Prozent der Daten zum Testen verwendet werden
random_state = 0 Zufälliger Startwert beim Teilen von Daten (normalerweise nicht verwendet)
Der Entscheidungsbaum ist "eine Reihe von if-Anweisungen, die automatisch Bedingungen lernen".
Numpy
** So erstellen Sie ein mehrdimensionales Array mit denselben Elementen ** Nullen (Größe): Mehrdimensionales Array mit allen Elementen 0 Einsen (Größe): Mehrdimensionales Array mit allen Elementen 1 full (Größe, Wert): Ein mehrdimensionales Array von Werten für alle Elemente zeros_like (mehrdimensionales Array): Mehrdimensionales Array mit allen 0 Elementen one_like (mehrdimensionales Array): Mehrdimensionales Array mit allen 1 Elementen full_like (mehrdimensionales Array, Wert): Ein mehrdimensionales Array, in dem alle Elemente Werte sind
** Fortlaufende Daten ** arange ([start,] stop [, step,], dtype = None): Kontinuierliche Datenerstellung wie range linspace (Start, Stopp, num = 50, Endpunkt = True, retstep = False, dtype = None): Kontinuierliche Datenerstellung, wenn der zu erstellende Bereich und die Anzahl der nums bestimmt werden
** Einheitsmatrix und Diagonalmatrix ** numpy.eye: Einheitsmatrix mit allen 1 Diagonalen numpy.diag: eine beliebige diagonale Matrix
Der Bewertungsstandard ist die Art der Maßnahme Der Bewertungsstandard ist der Maßstab der Maßnahme
Recommended Posts