[PYTHON] Lernrekord Nr. 21 (25. Tag)

Lernrekord (25. Tag)

Beginn des Studiums: Samstag, 7. Dezember

Unterrichtsmaterialien usw.: ・ Miyuki Oshige "Details! Python3 Introductory Note ”(Sotech, 2017): 12/7 (Sa) -12/19 (Do) gelesen ・ Progate Python-Kurs (insgesamt 5 Kurse): Ende 12/19 (Donnerstag) -12/21 (Samstag) ・ Andreas C. Müller, Sarah Guido "(japanischer Titel) Maschinelles Lernen ab Python" (O'Reilly Japan, 2017): 21.12. (Sa) - 23. Dezember (Sa) ・ Kaggle: Real or Not? NLP mit Katastrophen-Tweets: Veröffentlicht am Samstag, 28. Dezember, bis Freitag, 3. Januar Einstellung ・ ** Wes Mckinney "(japanischer Titel) Einführung in die Datenanalyse von Python" (O'Reilly Japan, 2018) **: 1/4 (Mittwoch) bis 1/13 (Montag) gelesen

"Einführung in die Datenanalyse mit Python"

Lesen Sie am 13. Januar

Kapitel 11 Zeitreihendaten

-Datenzeit, Zeit, Kalendermodule Sie können das Format mit str oder strftime angeben. % Y ist ein 4-stelliges Jahr,% y ist ein 2-stelliges Jahr usw. Verwenden Sie es wie datetime.strftime ('% Y-% m-% d').

-Indexreferenz Wenn Sie das Datum ['2000'] verwenden, können Sie auf die Daten des entsprechenden Datums verweisen. Generierung durch Angabe eines Bereichs date_range Datenverschiebung Sie können sich auch verschieben, indem Sie Verschiebung und Versatz angeben.

・ Die meisten Zeitreihen werden von der Vereinbarung World Time UTC verarbeitet. Holen Sie sich Zeitzonenobjekte mit pytz.timezone und generieren Sie sie Mit tz_localize lokalisieren und mit tz_convert in eine andere Zeitzone konvertieren. Sie können die Zeitzone auch beim Generieren des Zeitstempels angeben.

-Zeitreihenfrequenz kann konvertiert werden. Verwenden Sie die Resample-Methode. Downsampling zum Aggregieren zu weniger häufigen Daten und umgekehrt zum Upsampling Bestimmen Sie für ein Resample ('5min', geschlossen = XXX), geschlossen, ob der linke oder rechte Abschnitt geschlossen ist (nicht im Wert enthalten). OHLC-Funktion (Open-High-Low-Close), Eröffnungspreis, Schlusskurs, höchster Preis, niedrigster Preis können aggregiert werden.   -Fensterfunktion: Gewichte, die exponentiell abnehmen, werden auf die Daten angewendet. Eine Funktion, die bis auf ein bestimmtes endliches Intervall 0 ist. Reduziert Rausch- und Lückendaten. Sie können Ihre eigenen Funktionen anwenden, indem Sie rollen, erweitern, überspannen und anwenden.

Kapitel 12 Pandas: Advanced Edition

・ Kategorisch für Pandas Es besteht die Möglichkeit, dass die Verarbeitungsgeschwindigkeit und die Speichernutzung durch Verwendung verbessert werden können.

-Groupby kann eine allgemeine Verarbeitung für bestimmte Elemente durchführen. Dasselbe kann mit der Transformation unter Verwendung eines Lambda-Ausdrucks wie Lambda x: x.mean () durchgeführt werden.  df.transform(lambda x:x.mean()) Gruppenberechnung ist auch durch Transformation möglich normalisiert = (df ['A'] - b.transform ('mean')) / b.transform ('std') usw. Die Aggregation für jede Gruppe kann mehrfach erfolgen, oder die Vorteile von Vektoroperationen überwiegen die Gesamtvorteile.

Kapitel 13 Einführung in die Modellierungsbibliothek in Python

-Der Kontaktpunkt zwischen Pandas und der Analysebibliothek ist normalerweise ein NumPy-Array. Verwenden Sie das Attribut .value, um einen Datenrahmen in NumPy zu konvertieren. (Wird ein Ndarray.)  data.values Übergeben Sie bei der Rückkehr ein zweidimensionales ndarray und geben Sie den Spaltennamen an.  pd.DataFrame(data.values, columns=['one', 'two', 'three']

-Wenn nur ein Teil der Spalte verwendet wird Es ist besser, Werte zu verwenden, während auf den Index mit loc verwiesen wird.  model_cols = ['x0', 'x1']  data.loc[:, model_cols].values Jetzt können Sie nur ** x0, x1 ** aller ** Zeilen ** mit Array extrahieren.

Ersetzen Sie einige durch Dummy-Variablen


dummies = pd.get_dummies(data.category, prefix='category')
data_with_dummies = data.drop('category', axis=1).join(dummies)

#Erstellen Sie einen Dummy, löschen Sie die ursprüngliche Spalte mit drop und fügen Sie sie mit join hinzu.

Recommended Posts

Lernrekord Nr. 21 (25. Tag)
Lernrekord Nr. 10 (14. Tag)
Lernrekord Nr. 24 (28. Tag)
Lernrekord Nr. 23 (27. Tag)
Lernrekord Nr. 25 (29. Tag)
Lernrekord Nr. 26 (30. Tag)
Lernrekord Nr. 20 (24. Tag)
Lernrekord Nr. 14 (18. Tag) Kaggle4
Lernrekord Nr. 15 (19. Tag) Kaggle5
Lernrekord 4 (8. Tag)
Lernrekord 9 (13. Tag)
Lernrekord 3 (7. Tag)
Lernrekord 5 (9. Tag)
Lernrekord 6 (10. Tag)
Lernrekord 8 (12. Tag)
Lernrekord 1 (4. Tag)
Lernrekord 7 (11. Tag)
Lernrekord 2 (6. Tag)
Lernrekord 16 (20. Tag)
Lernrekord 22 (26. Tag)
Lernrekord 13 (17. Tag) Kaggle3
Lernrekord Nr. 17 (21. Tag)
Lernrekord 12 (16. Tag) Kaggle2
Lernrekord Nr. 18 (22. Tag)
Lernrekord Nr. 19 (23. Tag)
Lernrekord Nr. 29 (33. Tag)
Lernrekord Nr. 28 (32. Tag)
Lernrekord Nr. 27 (31. Tag)
Lernrekord 11 (15. Tag) Kaggle-Teilnahme
Programmieren des Lernprotokolls 2. Tag
Lernaufzeichnung
Lernrekord Nr. 3
Lernrekord Nr. 1
Lernrekord Nr. 2
Python-Lerntag 4
Lernaufzeichnung (2. Tag) Scraping von #BeautifulSoup
Lernaufzeichnung (4. Tag) #Wie man den absoluten Pfad vom relativen Pfad erhält
Bisherige Lernbilanz
Linux-Lernprotokoll ① Planen
<Kurs> Tiefes Lernen: Day2 CNN
Lernaufzeichnung (3. Tag) # CSS-Selektorbeschreibungsmethode #Scraping with BeautifulSoup
<Kurs> Tiefes Lernen: Tag 1 NN
Lerndatensatz (6. Tag) #Set-Typ #Dictionary-Typ #Mutuelle Konvertierung des Listen-Taple-Sets #ndarray-Typ #Pandas (DataFrame-Typ)
Themen> Deep Learning: Tag 3 RNN
Studiere gründlich Deep Learning [DW Tag 0]