Kombinieren Sie sich wiederholende Zeichenfolgen mit regulären Python-Ausdrücken zu einer.

Was du machen willst

Ich wollte etwas tun, wenn die in das PDF eingebetteten Zeichen seltsam waren. Ich möchte wie folgt aussehen. Ich möchte dieselben Zeichen kombinieren, wenn sie nacheinander wiederholt werden.

Ah ah → Ah Aiuueo → Aiueo ABCABCABC → ABCABCABC Zustimmung von Yui Yui → Zustimmung von Yui Yui

Was ich getan habe

python


    #Es wird angenommen, dass das Ergebnis bereits eine Zeichenfolge enthält
    result = re.sub(r"(.)\1{1,}", "\g<1>", result)  #Sammle sich wiederholende Strings

Andere Schnipsel

Textformatierung


import re
from unicodedata import normalize
def clean_text(txt:str):
    result = re.sub(r"\s| ",'',txt)                #Entfernen Sie zuerst leere Zeichen, um die Verarbeitung zu vereinfachen
    result = normalize('NFKC', result)              #Unicode-Normalisierung
    result = re.sub(r"(.)\1{1,}", "\g<1>", result)  #Sammle sich wiederholende Strings
    if (')(cid:' in result):                        #Korrespondenz bei Zeichen eingebettetem PDF
        return ''
    return result

Versuchen wir es mit Louis Copipe!

Louise


import re

text = "Louise! Louise! Louise! Ruizuuuuuuuuaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa !! !!\n\
Ah ah ah ... ah ... ah! Ah ah ah ah! !! !! Louise Louise Louise Wow Wow Ah Ah! !! !!\n\
Ah Kunka Kunka! Kunka Kunka! Suha Suha! Suha Suha! Es riecht gut ... Kun\n\
Hmm! Ich möchte die rosa blonden Haare von Louise Francoise-tan quetschen! Kunka Kunka! Aa! !!\n\
habe mich geirrt! Ich möchte flauschig sein! Mofumofu! Mofumofu! Haar Haar Mofumofu! Knuspriger Mofumofu ... Kyun Kyun Kyu! !!\n\
Der 12. Band des Romans, Louise, war süß! !! Ah ah ah ah ah ah! !! Fahhhhh! !!\n\
Ich bin froh, dass die zweite Staffel des Anime ausgestrahlt wurde, Louis-tan! Oh oh oh oh! süß! Louise! süß! A-aa ~ aa!"

print(re.sub(r"(.)\1{1,}", "\g<1>", text))

#Louise! Louise! Louise! Louis Wow Wow!
#Ah ... ah ... ah! Aa! Louise Louise Louise Wow!
#Ah Kunka Kunka! Kunka Kunka! Suha Suha! Suha Suha! Es riecht nach ... Kun
#Hmm! Ich möchte die rosa blonden Haare von Louise Francoise-tan quetschen! Kunka Kunka! Aa!
#habe mich geirrt! Ich möchte flauschig sein! Mofumofu! Mofumofu! Haare flauschig! Knuspriger Mofumofu ... Kyun Kyun Kyu!
#Der 12. Band des Romans, Louise, war süß! Ah ... ah ... ah! Fah!
#Ich bin froh, dass die zweite Staffel des Anime ausgestrahlt wurde, Louis-tan! Aa! Süß! Louise! Süß! Ahhhh!

Referenz

Reverse-Austausch. Ich habe verschiedene Dinge gesehen, aber ich hatte das Gefühl, dass sie alle hier waren.

Gruppierung bei Verwendung regulärer Ausdrücke in Python. Für Python dauerte es eine Weile, bis mir klar wurde, dass ich \ g <1> anstelle von $ 1 schreiben musste.

Recommended Posts

Kombinieren Sie sich wiederholende Zeichenfolgen mit regulären Python-Ausdrücken zu einer.
String-Ersetzung durch regulären Python-Ausdruck
Bestimmen Sie, ob die Zeichenfolge Zeit mit einem regulären Python-Ausdruck ist
Machen Sie eine Lotterie mit Python
Manipulation regulärer Ausdrücke durch Python
Lassen Sie uns eine GUI mit Python erstellen.
Erstellen Sie ein Empfehlungssystem mit Python
Lassen Sie uns ein Diagramm mit Python erstellen! !!
Holen Sie sich die passende Zeichenfolge in den regulären Ausdruck und verwenden Sie sie beim Ersetzen unter Python3 erneut
Lassen Sie uns mit Python ein Shiritori-Spiel machen
Ich habe versucht, mit Python einen regulären Ausdruck für "Betrag" zu erstellen
Ich habe versucht, mit Python einen regulären Ausdruck von "Zeit" zu erstellen
Ich habe versucht, mit Python einen regulären Ausdruck von "Datum" zu erstellen
Lassen Sie uns mit Python langsam sprechen
Erstellen Sie ein Webframework mit Python! (1)
Erstellen Sie eine Desktop-App mit Python mit Electron
Machen wir einen Twitter-Bot mit Python!
Erstellen Sie ein Webframework mit Python! (2)
[Python] Eine Funktion, die die gesamte Zeichenfolge mit einem regulären Ausdruck durchsucht und alle übereinstimmenden Zeichenfolgen abruft.
Machen Sie Twitter Trend Bot mit Heroku + Python
Ich möchte ein Spiel mit Python machen
Versuchen Sie, in Python einen "Entschlüsselungs" -Code zu erstellen
Mach ein Janken-Spiel in einer Zeile (Python)
Ersetzen wir UWSC durch Python (5) Machen wir einen Roboter
Versuchen Sie, mit Python eine Diedergruppe zu bilden
Entschlüsseln Sie eine unter iOS mit Python verschlüsselte Zeichenfolge
[Python] Ausdruck (1,2) macht kein Taple mit Klammern
Pythons Lambda-Ausdruck ...
Regulärer Ausdruck im Pymongo
Python-Memo für reguläre Ausdrücke
Regulärer Ausdruck in Python
So konvertieren / wiederherstellen Sie einen String mit [] in Python
Lassen Sie uns ein Befehls-Standby-Tool mit Python erstellen
[Übung] Erstellen Sie eine Watson-App mit Python! # 2 [Übersetzungsfunktion]
[Übung] Erstellen Sie eine Watson-App mit Python! # 1 [Sprachdiskriminierung]
Erstellen Sie einen einfachen Slackbot mit einer interaktiven Schaltfläche in Python
[Lass uns mit Python spielen] Ein Haushaltsbuch erstellen
Versuchen Sie, ein einfaches Spiel mit Python 3 und iPhone zu erstellen
Machen Sie mit Python einen Haltepunkt auf der c-Ebene
Beim Schreiben einer if-Anweisung mit einem regulären Ausdruck
Erstellen Sie mit Python Pandas Py Installer ein CSV-Formatierungswerkzeug
kanonischer Python-Ausdruck oder Match-Objekt-Memo
Was ist Gott? Erstelle einen einfachen Chatbot mit Python
[Super einfach] Machen wir einen LINE BOT mit Python.
Ändern Sie die zu ersetzende Zeichenfolge entsprechend der übereinstimmenden Zeichenfolge, indem Sie sie durch den regulären Python-Ausdruck ersetzen
[Python] Verwenden Sie eine Zeichenfolgenfolge
Python-Theorie regulärer Ausdruck Anmerkungen
Erstelle Puyopuyo AI mit Python
Erstellen Sie ein Lesezeichen in Python
Erstellen Sie ein Verzeichnis mit Python
String-Format mit Python% -Operator
Machen Sie ein Feuer mit kdeplot
Lassen Sie uns mit Python einen Web-Socket-Client erstellen. (Zugriffstoken-Authentifizierung)
[Übung] Erstellen Sie eine Watson-App mit Python! # 3 [Klassifizierung der natürlichen Sprache]
Nehmen Sie schnell eine Abfragezeichenfolge mit API Gateway-> Lambda (Python)
Verknüpfen Sie Python Enum mit einer Funktion, um es aufrufbar zu machen
Experimentieren Sie mit Python, um ein PDF für Selbstversorger für Kindle zu erstellen