[PYTHON] Correction des caractères déformés lors du traitement du japonais dans les requêtes

environnement

Python: 3.5 Requests: 2.11.1

Aperçu

Lorsque j'obtiens une page japonaise à l'aide de requêtes et que je l'affiche, des caractères déformés se produisent. Cette fois, dans mon cas, cela s'est produit lorsque l'encodage côté page était Shift-JIS.

import requests

response = requests.get('Page japonaise appropriée')
print(response.encoding)

Quand je l'ai recherché, ISO-8859-1 a été retourné. Apparemment, si vous ne parvenez pas à obtenir correctement le code de caractère, le modifiez-vous correctement? ??

Solution

import requests

response = requests.get('Page japonaise appropriée')
response.encoding = response.apparent_encoding  #Ajouter cette ligne

Lorsque apparent_encoding est appelé, il semble que la bibliothèque soit utilisée pour déterminer correctement le code de caractère. Dans ce cas, les caractères ne sont plus déformés.

référence

https://blog.aoshiman.org/entry/118/

Recommended Posts

Correction des caractères déformés lors du traitement du japonais dans les requêtes
Éliminez les caractères japonais brouillés dans les données JSON acquises par l'API.
Élimination des caractères japonais brouillés de matplotlib et NetworkX de la bibliothèque Python
Résolvez les caractères japonais brouillés dans matplotlib de Jupyter Notebook sur Docker
[Note] Les caractères japonais sont déformés avec atom-runner
Éliminez les caractères japonais brouillés dans les graphiques matplotlib avec Cloud Pak for Data Notebook
Windows Qt5.4 Python3.4 QProcess caractères japonais brouillés
Gère les caractères japonais UTF-8 dans la base de données MySQL de Python.
Créer une image avec des caractères avec python (japonais)
[EC2] Empêcher les caractères déformés lorsqu'ils sont capturés avec du sélénium
[Python] Lire le csv japonais avec des pandas sans caractères déformés (extraire davantage les colonnes écrites en japonais)
Réponse forcée lorsque l'avertissement apparaît dans la bibliothèque de requêtes de Python
Comment éliminer les caractères déformés dans l'image de sortie matplotlib
Sortie japonaise lors de l'utilisation de python dans Visual Studio
Lorsqu'une erreur se produit dans le scraping python (requêtes)
[EC2] Empêcher les caractères japonais brouillés dans le sélénium (non compatible)