[PYTHON] Lernrekord 11 (15. Tag) Kaggle-Teilnahme

Lernrekord (15. Tag)

Beginn des Studiums: Samstag, 7. Dezember

Unterrichtsmaterialien usw.: ・ Miyuki Oshige "Details! Python3 Introductory Note ”(Sotech, 2017): 19.12. (Donnerstag) Abgeschlossen ・ Progate Python-Kurs (insgesamt 5 Kurse): Endet am Samstag, den 21. Dezember ・ Andreas C. Müller, Sarah Guido "(japanischer Titel) Maschinelles Lernen ab Python" (O'Reilly Japan, 2017): Abschluss am Samstag, 23. Dezember

Kaggle erste Teilnahme

Teilnahmewettbewerb: Real or Not? NLP mit Katastrophen-Tweets 24.12. (Di) ~

Das Problem besteht darin, Tweets zu sortieren, die Informationen zu Katastrophen enthalten, und solche, die dies nicht tun. Als Feld entspricht es der Verarbeitung natürlicher Sprache.

Es wird bis März nächsten Jahres stattfinden, aber ich möchte es bis zum 10. Januar (Freitag), spätestens zwei Wochen nach dem heutigen Tag, einmal einreichen.

Ich hatte das Glück, mit den Leuten im Labor einer bestimmten Universität, die mir jetzt zu Dank verpflichtet sind, ein Team bilden zu können. Es ist also eine sehr ermutigende Situation, aber ich werde sie nachdrücklich ausgeben, damit sie nicht zuverlässig ist.

Datenvorverarbeitung

・ Verschaffen Sie sich mit head (), shape, description () einen Überblick über die Daten ・ Verstehen Sie die fehlenden Werte und die Anzahl der Trainingsdaten -Schneiden Sie unnötige (möglicherweise) Teile mit Tropfen ('Datenetikettenname', Achse = 1) -Extrahieren Sie den relevanten Textteil mit df ["Datenbezeichnungsname"] und listen Sie ihn mit tolist () auf.

Datenextraktion / Korpuserstellung

-Definieren Sie ein Stoppwort (und oder oder) und teilen Sie es mit split ()

Obwohl die Vektorisierung bisher erfolgreich war, habe ich festgestellt, dass die Anzahl der Dimensionen mehrere Tausend erreicht hat, weil sie gerade konvertiert wurde, und dass das Ziel angibt, ob die Informationen über die Katastrophe nicht mit den extrahierten Informationen verknüpft sind. ..

Im Moment habe ich nicht darüber nachgedacht, wie ich sie verbinden soll, aber ich werde morgen weiter herausfordern.

Recommended Posts

Lernrekord 11 (15. Tag) Kaggle-Teilnahme
Lernrekord 13 (17. Tag) Kaggle3
Lernrekord 12 (16. Tag) Kaggle2
Lernrekord Nr. 14 (18. Tag) Kaggle4
Lernrekord Nr. 15 (19. Tag) Kaggle5
Lernrekord 4 (8. Tag)
Lernrekord 9 (13. Tag)
Lernrekord 3 (7. Tag)
Lernrekord 5 (9. Tag)
Lernrekord 6 (10. Tag)
Lernrekord 1 (4. Tag)
Lernrekord 7 (11. Tag)
Lernrekord 2 (6. Tag)
Lernrekord 16 (20. Tag)
Lernrekord 22 (26. Tag)
Lernrekord Nr. 10 (14. Tag)
Lernrekord Nr. 24 (28. Tag)
Lernrekord Nr. 25 (29. Tag)
Lernrekord Nr. 26 (30. Tag)
Lernrekord Nr. 20 (24. Tag)
Programmieren des Lernprotokolls 2. Tag
Lernrekord Nr. 17 (21. Tag)
Lernrekord Nr. 18 (22. Tag)
Lernrekord Nr. 19 (23. Tag)
Lernrekord Nr. 28 (32. Tag)
Lernrekord Nr. 27 (31. Tag)
Lernaufzeichnung
Lernrekord Nr. 3
Lernrekord Nr. 1
Lernaufzeichnung (2. Tag) Scraping von #BeautifulSoup
Lernaufzeichnung (4. Tag) #Wie man den absoluten Pfad vom relativen Pfad erhält
AtCoder 6. Herausforderung von Dwango Vorläufiger Eintrag
Bisherige Lernbilanz
Yukicoder-Wettbewerb 266 Teilnehmerrekord
Yukicoder-Wettbewerb 263 Teilnehmerrekord
Yukicoder-Wettbewerb 243 Teilnehmerrekord
Yukicoder-Wettbewerb 273 Teilnehmerrekord
Yukicoder-Wettbewerb 252 Teilnehmerrekord
Yukicoder-Wettbewerb 259 Teilnehmerrekord
Yukicoder-Wettbewerb 249 Teilnehmerrekord
Yukicoder-Wettbewerb 241 Teilnehmerrekord
Yukicoder-Wettbewerb 257 Teilnehmerrekord
Yukicoder-Wettbewerb 246 Teilnehmerrekord
Yukicoder-Wettbewerb 275 Teilnehmerrekord
Yukicoder-Wettbewerb 274 Teilnehmerrekord
Yukicoder-Wettbewerb 247 Teilnehmerrekord
Yukicoder-Wettbewerb 261 Teilnehmerrekord
Linux-Lernprotokoll ① Planen
Yukicoder-Wettbewerb 248 Teilnehmerrekord
Lerndatensatz (6. Tag) #Set-Typ #Dictionary-Typ #Mutuelle Konvertierung des Listen-Taple-Sets #ndarray-Typ #Pandas (DataFrame-Typ)
Lernaufzeichnung (3. Tag) # CSS-Selektorbeschreibungsmethode #Scraping with BeautifulSoup
<Kurs> Tiefes Lernen: Day2 CNN
Yukicoder-Wettbewerb 270 (Mathematik-Wettbewerb) Teilnahmeprotokoll