Ein Memo, das doppelte Anführungszeichen in voller Breite mit regulären Python-Ausdrücken verarbeitet

Überblick

Zweck

  • Ich möchte die Zeichenfolge in dem Bereich extrahieren, der von doppelten Anführungszeichen in voller Breite umgeben ist
Beispiel)Er sagte: „Hallo Welt!Ich sagte

Von

Hello World!

Extrakt

Reguläre Ausdrücke

Konstruiert unter Bezugnahme auf das Folgende

Regulärer Ausdruck: Ausdruck, der nur dem Inhalt von Klammern entspricht

re.search(r"(?<=\“).*?(?=\”)", sentence)

Beachtung

Anfangs habe ich versucht, doppelte Anführungszeichen mit halber Breite zu verwenden, indem ich das Konvertierungspaket `` `jaconv``` von Python mit voller Breite und halber Breite verwendet habe, aber das hat nicht funktioniert.

Dies liegt daran, dass jaconv.normalize doppelte Anführungszeichen in voller Breite wie folgt verarbeitet.

'”'=> '"'
'“' => '``'

jaconv 0.2.4 -PyPI

Zusammenfassung

Bitte beachten Sie, dass es schwierig ist zu sagen, ob das doppelte Anführungszeichen in voller oder halber Breite ist und welcher Zeichencode es ist.

Doppelte Zitate in voller Breite sind eine schlechte Zivilisation! </ B>

Referenz

Recommended Posts