Un mémo qui gère les guillemets doubles pleine largeur avec les expressions régulières Python

Aperçu

Objectif

  • Je souhaite extraire la chaîne de caractères de la plage entourée de guillemets doubles pleine largeur
Exemple)Il a dit "Hello World!J'ai dit

De

Hello World!

Extrait

Expressions régulières

Construit en référence à ce qui suit

Expression régulière: Expression qui correspond uniquement au contenu des parenthèses

re.search(r"(?<=\“).*?(?=\”)", sentence)

Attention

Au départ, j'ai essayé d'unifier en guillemets doubles demi-largeur en utilisant le package de conversion pleine largeur demi-largeur de python `` jaconv```, mais cela n'a pas fonctionné.

Cela est dû au fait que jaconv.normalize gère les guillemets doubles pleine largeur comme suit.

'”'=> '"'
'“' => '``'

jaconv 0.2.4 -PyPI

Résumé

Veuillez noter qu'il est difficile de dire si la double citation est pleine largeur ou demi-largeur et de quel code de caractère il s'agit.

La double citation pleine largeur est une mauvaise civilisation! </ B>

référence

Recommended Posts