[PYTHON] [EC2] Empêcher les caractères déformés lorsqu'ils sont capturés avec du sélénium

[EC2] Empêcher les caractères déformés lorsqu'ils sont capturés avec du sélénium

Des caractères déformés se sont produits lors de la capture d'écran de l'URL spécifiée par le sélénium de python. ..

▼ chrome (japonais) Top programme de capture

screenshot.py


from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.headless = True
options.add_argument('--window-size=1280,1024')

driver = webdriver.Chrome(options=options)

driver.get("https://www.google.co.jp/")
driver.save_screenshot('test.png')

driver.quit()

Caractères déformés

image.png

Avec des personnages brouillés alignés,

approche

python


sudo yum install ipa-gothic-fonts ipa-mincho-fonts ipa-pgothic-fonts ipa-pmincho-fonts

Installez le package de polices pour le japonais. Puis-je l'installer en cours de route? Est demandé, alors réglez-le sur "y".

image.png

Les caractères déformés ont été résolus avec succès.


## police noto Dans l'article ci-dessous, il y avait un article selon lequel les caractères déformés pouvaient être éliminés en insérant la police noto, mais je n'ai pas fonctionné ... https://qiita.com/onorioriori/items/4fa271daa3621e8f6fd9

python


#Déplacer vers le répertoire tmp pour le téléchargement zip
cd /tmp/ 

#Installez le package complet des polices Noto
wget https://noto-website-2.storage.googleapis.com/pkgs/Noto-hinted.zip

#Dégivrer
unzip Noto-hinted.zip

#/usr/share/Créer un répertoire sous les polices
mkdir -p /usr/share/fonts/opentype/noto

#Déplacer le fichier correspondant
cp *otf *ttf /usr/share/fonts/opentype/noto


#Mettre à jour le cache des polices (pas besoin de faire)
fc-cache -f -v

J'ai mis le fichier dans le répertoire spécifié, mais les caractères sont toujours déformés.

image.png

S'il vous plaît laissez-moi savoir si quelqu'un sait comment utiliser noto. ..

Supplément: Qu'est-ce que la police noto?

Un package linguistique développé conjointement par Google, Adobe et Iwata. Compatible avec toutes les langues.

Si les caractères sont déformés, beaucoup de □ comme le tofu seront affichés, donc aucun tofu n'est abrégé pour ne pas faire de police.

Page officielle


Vous pouvez télécharger le package pour chaque police ou télécharger le package complet.

▼ URL du package complet https://noto-website-2.storage.googleapis.com/pkgs/Noto-hinted.zip

▼ noto Sans URL https://noto-website-2.storage.googleapis.com/pkgs/NotoSans-hinted.zip

Recommended Posts

[EC2] Empêcher les caractères déformés lorsqu'ils sont capturés avec du sélénium
[EC2] Empêcher les caractères japonais brouillés dans le sélénium (non compatible)
Le Katakana demi-largeur n'est pas brouillé lors de l'utilisation de python + sélénium execute_script
[Développement Web avec Python] Mesures contre les caractères déformés lors de la sortie html
[Note] Les caractères japonais sont déformés avec atom-runner
Correction des caractères déformés lors du traitement du japonais dans les requêtes
Grattage au sélénium ~ 2 ~
Grattage avec du sélénium