Hier finden Sie eine Zusammenfassung zum Löschen verschiedener Arten von Leerzeichen, einschließlich Leerzeichen mit halber Breite und Leerzeichen mit voller Breite.
macOS Catalina Version 10.15.4 python 3.8.0
Verwenden Sie str.split ()
#\u3000 ist ein Raum voller Breite
text = "a\u3000 b\t\nc\r\n"
text = ''.join(text.split())
Verwenden Sie str.splitlines ()
text = "a\u3000 b\t\nc\r\n"
text = ''.join(text.splitlines())
Verwenden Sie str.translate ()
text = "a\u3000 b\t\nc\r\n"
table = str.maketrans({
'\u3000': '',
' ': '',
'\t': ''
})
text = text.translate(table)
Wenn Sie viele andere Zeichen löschen möchten, ist es einfacher, das Argument "str.maketrans ()" in die Notation des Einschlusstyps zu schreiben.
text = "a\u3000 b\t\nc\r\nd\x0ce\x0bf"
table = str.maketrans({
v: '' for v in '\u3000 \x0c\x0b\t' #Oder['\u3000',' ','\x0c','\x0b','\t']
})
text = text.translate(table)
Ich habe Ihnen einige Ratschläge zur Verwendung regulärer Ausdrücke in Kommentaren gegeben, daher werde ich sie im Folgenden zusammenfassen. Danke für deinen Kommentar.
import re
#Entfernen Sie Zeilenumbrüche, Tabulatoren, Leerzeichen usw. auf einmal
text = "a\u3000\n\n b\t\nc\r\nd\x0ce\x0b\rf\r\n"
text = re.sub(r"\s", "", text)
#Zeilenvorschubcode (\r\Noch\n) Nur sofort löschen
text = "a\u3000\n\n b\t\nc\r\nd\x0ce\x0b\rf\r\n"
text = re.sub(r"[\r\n]", "", text)
#Löschen Sie einige Leerzeichen (z. B. Leerzeichen in voller Breite, Leerzeichen in halber Breite, Registerkarte) mit Ausnahme des Zeilenvorschubcodes sofort
text = "a\u3000\n\n b\t\nc\r\nd\x0ce\x0b\rf\r\n"
text = re.sub(r"[\u3000 \t]", "", text)
Recommended Posts