[PYTHON] Lernrekord Nr. 29 (33. Tag)

Lernrekord (33. Tag)

Beginn des Studiums: Samstag, 7. Dezember

Unterrichtsmaterialien usw.: ・ Miyuki Oshige "Details! Python3 Introductory Note ”(Sotech, 2017): 12/7 (Sa) -12/19 (Do) gelesen ・ Progate Python-Kurs (insgesamt 5 Kurse): Ende 12/19 (Donnerstag) -12/21 (Samstag) ・ Andreas C. Müller, Sarah Guido "(japanischer Titel) Maschinelles Lernen ab Python" (O'Reilly Japan, 2017): 21.12. (Sa) - 23. Dezember (Sa) ・ Kaggle: Real or Not? NLP mit Katastrophen-Tweets: Veröffentlicht am Samstag, 28. Dezember, bis Freitag, 3. Januar Einstellung ・ Wes Mckinney "(japanischer Titel) Einführung in die Datenanalyse von Python" (O'Reilly Japan, 2018): 1/4 (Mittwoch) bis 1/13 (Montag) gelesen ・ Yasuki Saito "Tiefes Lernen von Null" (O'Reilly Japan, 2016): 1/15 (Mi) -1/20 (Mo) ・ ** François Chollet „Tiefes Lernen mit Python und Keras“ (Queep, 2018): 1/21 (Di) ~ **

"Deep Learning mit Python und Keras"

S.261 Kapitel 6 Deep Learning für Texte und Sequenzen Das Lesen ist zur Hälfte abgeschlossen.

Gelernte Wörter einbetten (2. Tag)

Die Tokenisierung, mit der gestern zu kämpfen hatte, wurde abgeschlossen.

Datenvorverarbeitung (Verarbeitung natürlicher Sprache)


#type : pandas.core.series.Series

#In Kleinbuchstaben konvertieren
X_l = X.str.lower()

#Ersetzen Sie unnötige Zeichen durch Leerzeichen halber Breite.
X_r = X_l.replace(',', ' ').replace('.', ' ').replace('#', ' ').replace('#', ' ').replace('!', ' ').replace('!', ' ').replace(' ', ' ')

#Teilen Sie jedes Wort durch ein Leerzeichen halber Breite als Trennzeichen
X_s = X_r.str.split(' ')

#Gemeinsam definiert
def make_vector(df):
    X_l = df.str.lower()
    X_r = X_r = X_l.replace(',', ' ').replace('.', ' ').replace('#', ' ').replace('#', ' ').replace('!', ' ').replace('!', ' ').replace(' ', ' ')
    X_s = X_r.str.split(' ')
    return X_s

Nachdem wir den aus dem Datensatz abgerufenen Text mit einem Token versehen haben, müssen wir nur noch das definierte Modell trainieren. (Unter der Umsetzung)

Übrigens habe ich zuerst versucht, eins nach dem anderen herauszunehmen und es mit einer for-Anweisung wie folgt zu drehen, aber es funktioniert nicht. a.png Ich fragte mich, ob es in Ordnung wäre, die Serie so wie sie ist vorzuverarbeiten, ohne sie herausnehmen zu müssen, also sah ich nach und stellte fest, dass es immer noch möglich war. Schreiben Sie unter Bezugnahme auf den Pandas-Beamten (API-Referenz, Serie) für die Vorverarbeitung Erfolgreich.

Recommended Posts

Lernrekord Nr. 19 (23. Tag)
Lernrekord Nr. 29 (33. Tag)
Lernrekord Nr. 10 (14. Tag)
Lernrekord Nr. 17 (21. Tag)
Lernrekord Nr. 18 (22. Tag)
Lernrekord Nr. 24 (28. Tag)
Lernrekord Nr. 28 (32. Tag)
Lernrekord Nr. 23 (27. Tag)
Lernrekord Nr. 25 (29. Tag)
Lernrekord Nr. 26 (30. Tag)
Lernrekord Nr. 20 (24. Tag)
Lernrekord Nr. 27 (31. Tag)
Lernrekord Nr. 14 (18. Tag) Kaggle4
Lernrekord Nr. 15 (19. Tag) Kaggle5
Lernrekord 4 (8. Tag)
Lernrekord 9 (13. Tag)
Lernrekord 3 (7. Tag)
Lernrekord 5 (9. Tag)
Lernrekord 6 (10. Tag)
Programmieren des Lernprotokolls 2. Tag
Lernrekord 1 (4. Tag)
Lernrekord 7 (11. Tag)
Lernrekord 2 (6. Tag)
Lernrekord 16 (20. Tag)
Lernrekord 22 (26. Tag)
Lernrekord 13 (17. Tag) Kaggle3
Lernrekord 12 (16. Tag) Kaggle2
Lernaufzeichnung
Lernrekord Nr. 3
Lernrekord Nr. 1
Lernrekord 11 (15. Tag) Kaggle-Teilnahme
Lernaufzeichnung (3. Tag) # CSS-Selektorbeschreibungsmethode #Scraping with BeautifulSoup
Lernaufzeichnung (2. Tag) Scraping von #BeautifulSoup
Bisherige Lernbilanz
Linux-Lernprotokoll ① Planen
<Kurs> Tiefes Lernen: Day2 CNN
<Kurs> Tiefes Lernen: Tag 1 NN
Themen> Deep Learning: Tag 3 RNN
63. Tag habe ich Tensorflow installiert.
Studiere gründlich Deep Learning [DW Tag 0]
Lernaufzeichnung (4. Tag) #Wie man den absoluten Pfad vom relativen Pfad erhält