[Python] Werden Sie die Datierung mit regulären Ausdrücken los

Der Anfang davon

Ich habe Daten auf Twitter gesammelt, aber danach habe ich sie in Ruhe gelassen. Wenn ich mir die Daten lange anschaue, ist der mysteriöse Stadt-, Dorf- und Dorftweet von fav0 dating Wansaka Wansaka ……. Ich habe es tatsächlich gefunden, indem ich Twitter durchsucht habe.

image.png

Der Benutzername war so obszön, dass ich ihn versteckte ... Was ist das für ein mysteriöses Wort ... Es war vorher ein bisschen mehr Satz ...? Früher habe ich ein bestimmtes Wort angegeben, und als es traf, habe ich mich immer verabschiedet, aber es gibt kein gemeinsames Wort, das mit dieser Anzahl von Zeichen angegeben werden kann.

Also werde ich es mit einem regulären Ausdruck löschen.

Quelle

Dokan bei jeder Probe der Funktionsprüfung. Irdenes Rohr.

Auf den ersten Blick als murmelndes Muster ① "Ein Zeichen von flachem Kana" "Einfaches Kana oder Interpunktion" "Kommunaler Name" ② "Einfaches Pseudonym 3 Zeichen" "Symbol" "Kommunaler Name" Da dies die beiden sind, ersetzen Sie die entsprechende durch eine leere und löschen Sie dann die leere Zeile.

Die Daten befinden sich in einem Datenrahmen, also werde ich es dort schaffen. Es ist schon eine Weile her, seit ich eine Python-Zeit hatte. Es ist bald vorbei.

import pandas as pd
import re
DF_samp=pd.DataFrame({'col_0': {'row_0': "Oh Osaka City", 'row_1': "Ups, Stadt Osaka aaa", 'row_2': "Ups, Stadt Osaka"},'col_1': {'row_0': 3, 'row_2': 4, 'row_3': 5},})
cols=DF_samp.col_0
cols0=cols.str.replace("[Ah-Von][Ah-Von][!-/:-@?[-`{-~.. , ... \].+[Stadt, Dorf|Dorf|Stadt]$|[Ah-Von][Ah-Von!-/:-@?[-`{-~.. , ... \].+[Stadt, Dorf|Dorf|Stadt]$", '')
DF_samp.col_0=cols0
DF_samp.dropna(subset=['col_0'])

Damit sind nur die entsprechenden mysteriösen Sätze beseitigt. Yattane. Ich habe das Gefühl, ich kann die Stimme fragen hören, ob ich dort Ersatz mache, aber ich mag es schon lange nicht mehr ...

Und nun

Ich erkannte, dass ein neues Muster kommen könnte, wenn dies von den BOT-Mitarbeitern gesehen würde ... Zu dieser Zeit jedoch.

Wie auch immer, ich möchte in einer Welt sein, in der ich effizient blockieren kann! Nun, es ist die API, die Tweets sammelt, also ist sie diesmal nicht mit Blöcken verbunden.

Recommended Posts

[Python] Werden Sie die Datierung mit regulären Ausdrücken los
Befreien Sie sich mit Python und regulären Ausdrücken von schmutzigen Daten
Umgang mit regulären Ausdrücken durch PHP / Python
[Python] Reguläre Ausdrücke Reguläre Ausdrücke
Ersetzen Sie Nicht-ASCII durch reguläre Ausdrücke in Python
Python: Vereinfachte morphologische Analyse mit regulären Ausdrücken
Entfernen Sie DICOM-Bilder in Python
Holen Sie sich CPU-Informationen von Raspberry Pi mit Python
Holen Sie sich ein Date mit Python
Holen Sie sich mit Python den Betriebsstatus von JR West
Holen Sie sich den Ländercode mit Python
Holen Sie sich Twitter-Timeline mit Python
Holen Sie sich Youtube-Daten mit Python
Befreien Sie sich von Pythons KeyError
Zahlen mit regulären Ausdrücken extrahieren
Holen Sie sich die Thread-ID mit Python
Manipulation regulärer Ausdrücke durch Python
Über Python und reguläre Ausdrücke
Beginnen Sie mit Python! ~ ② Grammatik ~
Holen Sie sich Lager mit Python
Holen Sie sich das Home-Verzeichnis mit Python
Holen Sie sich Tastaturereignis mit Python
Holen Sie sich Alembic-Informationen mit Python
Holen Sie sich eine Liste der mit Python + Selen gekauften DMM-E-Books
Beispiel für das Parsen von HTTP GET und JSON mit Pfefferpython
Holen Sie sich die Quelle der Seite unbegrenzt mit Python zu laden.
Langsames scp -pr loswerden
Beginnen Sie mit Python! ~ ① Umweltbau ~
Link, um mit Python zu beginnen
Holen Sie sich Bewertungen mit Python Googlemap API
Ich kann mich nicht an reguläre Python-Ausdrücke erinnern
Holen Sie sich Web-Screen-Capture mit Python
Holen Sie sich das Wetter mit Python-Anfragen 2
[Python] Mit DataReader Wirtschaftsdaten abrufen
Erste Schritte mit Python Grundlagen von Python
Erste Schritte mit Python
String-Ersetzung durch regulären Python-Ausdruck
Lebensspiel mit Python! (Conways Spiel des Lebens)
[Kleine Geschichte] Holen Sie sich mit Python einen Zeitstempel
10 Funktionen von "Sprache mit Batterie" Python
Holen Sie sich Qiita-Trends mit Python-Scraping
Implementierung der Dyxtra-Methode durch Python
Koexistenz von Python2 und 3 mit CircleCI (1.0)
Beginnen Sie mit Python mit Blender
Holen Sie sich Wetterinformationen mit Python & Scraping
Bei Verwendung regulärer Ausdrücke in Python
Grundlegendes Studium von OpenCV mit Python
Python-Technik für diejenigen, die Anfänger loswerden wollen
Ruft eine Liste der Dateien in einem Ordner mit Python ohne Pfad ab
PhytoMine-I hat versucht, mit Python die genetischen Informationen der Pflanze zu erhalten
Ermitteln Sie mit Selenium + PhantomJS + Python die Breite des Div auf der Serverseite
Überlappende reguläre Ausdrücke in Python und Java
Holen Sie sich mit Python zusätzliche Daten zu LDAP
Grundlagen der binärisierten Bildverarbeitung durch Python
Abrufen von Eigenschaftsinformationen durch Scraping mit Python
[Beispiel für eine Python-Verbesserung] Python mit Codecademy lernen
Holen Sie sich HTML von Element mit Python-Selen
[Hinweis] Mit Python Daten von PostgreSQL abrufen
Wie man lange Einschlüsse loswird