Dies ist eine Sammlung von selbst gestellten Fragen, die ich als eine der Studienmethoden im Test zur Analyse von Zertifizierungsdaten für Python3-Ingenieure gestellt habe, den ich im November 2020 durchgeführt habe. Ich hoffe, es wird denen helfen, die die Prüfung ablegen werden.
Der Erfahrungsbericht ist in diesem Artikel zusammengefasst ↓ https://qiita.com/pon_maeda/items/a6c008fb3d993278fccb
――Diese Sammlung von Fragen wird in Form von Fragen erstellt, z. B. zum Beantworten jeder Frage und zum Ausfüllen der Lücken, damit Sie sie in der Lückenzeit problemlos lösen können.
Maschinelles Lernen ist grob in drei Teile unterteilt. Es gibt drei Arten: () Lernen, () Lernen und () Lernen.
Die Variable (), auch als korrektes Label bezeichnet, wird nur zum Lernen () verwendet.
Die Methode, die verwendet wird, wenn diese korrekte Bezeichnung ein fortlaufender Wert ist, ist (), und die Methode, die verwendet wird, wenn es sich um einen anderen Wert handelt, ist ().
Was sind die beiden Hauptmethoden des unbeaufsichtigten Lernens?
venv ist ein Tool, mit dem Sie verschiedene Versionen von Python verwenden können. (Ja Nein)
Eine Funktion, mit der Sie den Dateinamen mit Platzhaltern in Python angeben können.
Japanische Lesung von Sünde, Cos und Tan.
Wie viele Napiers gibt es?
Was ist der Logarithmus von 1?
Der erste Stock ist.
Angenommen, wenn Sie einmal einen hexaedrischen Würfel werfen, wird Ihnen mitgeteilt, dass Sie eine ungerade Zahl haben, obwohl die Anzahl der Würfe unbekannt ist. Die Wahrscheinlichkeit wird in diesem Fall als () Wahrscheinlichkeit bezeichnet, die die Grundlage des () Satzes bildet.
4.1. NumPy
NumPy hat einen Typ für Arrays () und einen Typ für Matrizen ().
Eine der Funktionen von ↑ ist, dass Sie mehrere Typen verwenden oder einen Typ erstellen können.
Funktion zum Überprüfen der Größe in einem Array
Die Ravel-Funktion gibt () zurück, während die Flatten-Funktion () zurückgibt.
Funktion zum Überprüfen des Array-Typs
Funktion zum Konvertieren des Typs eines Arrays
Eine Funktion, die eine einheitliche Zufallszahl von Ganzzahlen generiert
Eine Funktion, die eine einheitliche Zufallszahl von Brüchen erzeugt
Eine Funktion, die eine Zufallszahl aus einer Standardnormalverteilung von Ganzzahlen erstellt
Ist die Standardnormalverteilung die Verteilung von Mittelwert () und Varianz ()?
Was ist die Funktion, um eine Zufallszahl für die Normalverteilung durch Angabe des Mittelwerts und der Standardabweichung zu generieren?
Eine Funktion, die eine Einheitsmatrix mit den angegebenen diagonalen Elementen erstellt
Eine Funktion, die ein Array angegebener Werte für alle Elemente erstellt
Eine Funktion, die ein gleichmäßig verteiltes Array in einem bestimmten Bereich erstellt
Eine Funktion, mit der Sie die Unterschiede zwischen den Elementen eines Arrays erkennen können
a = [1, 2, 3]
b = [4, 5, 6]
np.concatnate([a, b])
Welche der folgenden Möglichkeiten ist dann möglich?
[1, 2, 3, 4, 5, 6]
[[1, 2, 3],[4, 5, 6]]
[1, 2, 3, [4, 5, 6]]
Die Funktion np.concatnate ist die Richtungsverkettung (Zeile oder Spalte) bei Verkettung zwischen eindimensionalen Arrays.
Die Funktion np.concatnate wird standardmäßig in (Zeilen- oder Spalten-) Richtung verkettet, wenn zweidimensionale Arrays verkettet werden.
Wenn für diese Funktion das Argument Achse = 1 angegeben ist, wird es in Richtung () verkettet.
Eine Funktion, die ein zweidimensionales Array in Spaltenrichtung unterteilt.
Eine Funktion, die ein zweidimensionales Array in Zeilenrichtung unterteilt
Was bedeutet die Transposition eines zweidimensionalen Arrays?
Wenn es ein zweidimensionales Array namens a gibt, wie transponieren Sie es?
Welche Funktion vergrößert die Dimension eines eindimensionalen Arrays, ohne die Anzahl der Elemente anzugeben?
a = np.array([1, 5, 4])
# array([[1, 5, 4]])
Wie kann ich die obige Funktion verwenden, um die Dimension wie oben beschrieben zu erhöhen?
a = np.array([1, 5, 4])
# array([[1],
[5],
[4]])
Wie kann ich die obige Funktion verwenden, um die Dimension wie oben beschrieben zu erhöhen?
Welche Funktion generiert die Rasterdaten?
np.arange(1, 10, 3)
Was wird mit diesem Ergebnis passieren?
4.1.3. Jede Funktion von NumPy Was ist die praktische Funktionsgruppe von NumPy, die Array-Elemente wie sin () und log () gleichzeitig konvertiert?
Eine Funktion, die den absoluten Wert eines Array-Elements zurückgibt
a = np.array([0, 1, 2])
b = np.array([[-3, -2, -1],
[0, 1, 2]])
a + b
Was ist, wie oben erwähnt, die Summe aus dem zweidimensionalen Array und dem eindimensionalen Array?
Was bedeutet es, Skalare auf einem Array berechnen zu können?
Was bedeutet der @ -Operator?
A_matrix @ B_matrix
Auf andere Weise.
Eine Funktion, die die Anzahl von True in einem True / False-Array berechnet.
--np.count_nonzero Methode
Eine Funktion, die ermittelt, ob True in einem True / False-Array enthalten ist.
Eine Funktion, die ermittelt, ob alle Elemente in einem True / False-Array True sind.
4.2. pandas
Geben Sie mit df.head () und df.tail () nur die Zeile () am Anfang und Ende des DataFrame aus.
Funktion, um die Größe von df zu kennen
So erhalten Sie zwei Informationen aus df, A-Spalte und B-Spalte
So extrahieren Sie nur Datensätze mit 10.000 Schritten oder mehr, vorausgesetzt, es gibt df, einen Datenrahmen mit Schritten und verbrauchten Kalorien
Oder
df [df.loc [:," Schritte "]> = 10000]
df.query ('Schritte> = 10000')
etc.
So sortieren Sie in absteigender Reihenfolge der Schritte, vorausgesetzt, es gibt df, einen DataFrame mit aufgenommenen Schritten und Kalorien
One-Hot-Codierung einer Bewegungsindexspalte mit den drei Werten High, Mid und Low, wobei dem Präfix "Übung" hinzugefügt wird.
So erstellen Sie eine Reihe von Daten vom 2020-01-01 bis zum 2020-10-01.
Erstellen Sie eine Reihe von Daten für 100 Tage ab dem 01.01.2020.
Erstellen Sie ein Array nur für Samstag zwischen dem Datum 2020-01-01 und 2020-10-01.
Gruppieren Sie die Zeitreihendaten df in monatliche Daten und verwenden Sie den Durchschnittswert.
Oder
df.resample ('M'), mean ()
etc.
Argument, das verwendet wird, wenn Sie Nan mit dem vorherigen Wert in der Fillna-Funktion füllen möchten.
Wenn es sich um einen DataFrame handelt, füllen Sie ihn mit dem Wert eine Zeile darüber. Wenn es bfill ist, wird es mit dem Wert eine Zeile darunter gefüllt.
Was ist, wenn Sie den Argumenten der Fillna-Funktion einen Medianwert geben möchten?
Erstellen Sie df_merge, indem Sie df_1 und df_2 in Spaltenrichtung verketten.
Funktion zum Überprüfen des häufigsten Werts
Funktion, die den Medianwert angibt
Eine Funktion, die die Standardabweichung erzeugt (Beispielstandardabweichung)
Funktionen und Argumente, die die Standardabweichung (Grundgesamtheit) angeben
4.3. Matplotlib
Wo befindet sich das Kreisdiagramm?
Das Kreisdiagramm ist angeordnet (im Uhrzeigersinn oder gegen den Uhrzeigersinn).
Übergeben Sie das Argument () an die Methode (), um es im Uhrzeigersinn in einem Kreisdiagramm zu implementieren.
Übergeben Sie das Argument () an die Methode (), um anzugeben, wo mit dem Zeichnen des Diagramms in einem Kreisdiagramm begonnen werden soll.
4.4. scikit-learn
Welche Klasse wird verwendet, um die Daten zu ergänzen, wenn Werte fehlen?
Informationen zu dem Wert, der an das Strategieargument in der obigen Klasse übergeben wurde.
mean = ①、median = ②、most_frequent = ③
Welche Klasse codiert kategoriale Variablen?
Welches Attribut bestätigt den ursprünglichen Wert nach der Codierung?
Was ist die Hauptverarbeitungsmethode zusammen mit der Codierung von kategorialen Variablen?
Eine andere Möglichkeit, diese Codierung aufzurufen.
Wie nennt man eine Matrix mit vielen Komponenten 0 und eine Matrix mit vielen Nicht-Null-Komponenten?
Bei der verteilten Normalisierung werden Features so konvertiert, dass der Durchschnitt der Features () und die Standardabweichung () beträgt.
Welche Klasse führt eine verteilte Normalisierung durch?
Bei der minimalen / maximalen Normalisierung wird die Merkmalsmenge so konvertiert, dass der minimale Wert der Merkmalsmenge () und der maximale Wert () ist.
Welche Klasse führt eine minimale / maximale Normalisierung durch?
Die Klassifizierung ist eine typische Aufgabe des Lernens von Lehrern ().
Das obige verwendet die korrekte Bezeichnung, die als () -Variable bezeichnet wird.
Drei typische Klassifizierungsalgorithmen
Um das Klassifizierungsmodell zu erstellen, () die vorliegenden Daten.
"Lernen" in der Klassifizierung bezieht sich auf das Erstellen eines Klassifizierungsmodells unter Verwendung von () Datensätzen.
Was ist die Fähigkeit, auf unbekannte Daten zu reagieren, die aus Vorhersagen für den Testdatensatz des konstruierten Modells berechnet wurden?
Welche Funktion trennt jeden Datensatz?
Support Vector Machine ist ein Algorithmus, der nicht nur zur Klassifizierung und Regression, sondern auch für () verwendet werden kann.
Wenn zweidimensionale Daten, die zu zwei Klassen gehören, betrachtet werden, welche Daten sind der Grenze zwischen den Daten jeder Klasse am nächsten?
Wenn Sie zweidimensionale Daten betrachten, die zu zwei Klassen gehören, zeichnen Sie in () eine gerade Linie, sodass der Abstand zwischen den Unterstützungsvektoren am größten ist ().
Der Abstand zwischen dieser geraden Linie und dem Stützvektor heißt ().
Welche Daten von zufällig ausgewählten Stichproben und Merkmalen (erklärenden Variablen) werden in der zufälligen Gesamtstruktur verwendet?
Zufällige Gesamtstruktur besteht aus einer Reihe von Entscheidungsbäumen. Was bedeutet Lernen auf diese Weise mit mehreren Lernmaschinen?
Regression ist die Aufgabe, () Variablen mit () Variablen zu erklären, die durch Features dargestellt werden.
Wenn in der linearen Regression die erklärende Variable eine Variable ist, heißt sie (), und wenn es sich um zwei oder mehr Variablen handelt, heißt sie ().
Die Aufgabe von () Daten, ohne die Informationen zu beschädigen, über die die Daten verfügen.
In scikit-learn, welche Klasse von welchem Modul für die Hauptkomponentenanalyse verwendet wird.
Vier Indikatoren, die quantifizieren, wie viele Datenkategorien zugewiesen wurden.
() Rate, () Rate, () Rate, () Wert
Zusätzlich werden diese Indikatoren aus der () Matrix berechnet.
Es gibt einen Kompromiss zwischen der () Rate und der () Rate.
Eine daraus berechnete Kurve und () werden als Index verwendet, um die Genauigkeit der Vorhersagewahrscheinlichkeit für die Daten zu quantifizieren.
Hyperparameter haben während des Trainings Werte (bestimmt oder unbestimmt).
Zwei typische Methoden zur Optimierung von Hyperparametern.
Es ist ein schlechtes Problem, aber ich hoffe, es hilft jemandem. Wenn Sie Fehler machen, wäre ich Ihnen dankbar, wenn Sie diese kommentieren könnten. Danke bis zum Ende.
Recommended Posts