[PYTHON] Jusqu'à ce que la personne qui touche le terminal pour la première fois traduise automatiquement le papier en anglais avec "Just Translated Konnaku".

Contexte

"Honkyo Konnaku" est un programme de traduction d'articles en anglais créé par cabernet_rock. Si vous lancez l'URL du papier, il produira un fichier PDF dans lequel le texte original et sa traduction japonaise sont parallèles **, y compris les chiffres **. L'article suivant résume son fonctionnement et comment l'installer de manière simple à comprendre. Cependant, il y a quelques points que j'ai installés et je suis un peu bouché, et il y a quelques obstacles pour ceux qui ne sont pas habitués à faire fonctionner le terminal principal humide, donc je vais décrire la méthode d'installation pour ceux qui ouvrent le terminal pour la première fois. Mangez "la traduction japonaise Konnaku" et lisez l'article Utilisons la "traduction japonaise Konnaku".

environnement

PC: MacBook Pro 2020 OS: macOS Catalina (10.15.5) shell: zsh (5.7.1)

Méthode

installation de python

La version de python installée depuis le début sur mac est ancienne (série 2), installez la dernière version (série 3) (Référence: [installation Python3 (version Mac)](installation Python3 (version Mac))) ..

Tout d'abord, téléchargez le fichier pkg depuis le Site officiel. Au 4 septembre 2020, la version 3.8.5 était la dernière version. Double-cliquez sur le fichier pkg téléchargé pour l'installer. Fondamentalement, il n'y a aucun problème avec "continuer". Download_Python___Python_org.png

Ouvrez un terminal pour voir s'il a été installé. Le terminal se trouve dans Applications → Utilitaires. ユーティリティ.png Au démarrage du terminal, tapez "python3". Si le message "Python 3.8.5" (la valeur ici varie en fonction de la version) s'affiche, l'installation est réussie. tt_—Python—_80×24.png

Installation de wkhtmltopdf

wkhtmltopd est un programme de création de PDF à partir de HTML. Veuillez télécharger celui qui correspond à votre PC depuis le Site de téléchargement officiel. wkhtmltopdf.png Double-cliquez sur le fichier pkg téléchargé pour l'installer. Fondamentalement, il n'y a aucun problème avec "continuer". Après l'installation, ouvrez un terminal et entrez la commande suivante. Si "google.pdf" est créé, l'installation est réussie.

#Même contenu que l'article de l'auteur
wkhtmltopdf http://google.com google.pdf

tt_—-zsh—_80×24.png

Installation du pilote Chrome

ChromeDriver est un WebDriver Google Chrome. WebDriver est le logiciel nécessaire pour faire fonctionner le navigateur par programme, et il semble qu'il soit nécessaire de sortir le résultat de la traduction en html dans la traduction Konnaku (je ne comprends pas le mécanisme ici). Je pense que les autres navigateurs fonctionnent bien, mais j'utiliserai google chrome selon l'article de l'auteur (si vous n'avez pas goole chrome, veuillez l'installer). Voir: Python + Selenium effectue toutes les opérations automatiques de Chrome

Téléchargez le pilote Chrome depuis le site officiel. Downloads_-ChromeDriver-_WebDriver_for_Chrome.png Veuillez noter que ** téléchargez la même version ** que le google chrome installé sur votre PC. Vous pouvez vérifier la version de Google Chrome en allant dans Paramètres (une icône avec trois "・" dans le coin supérieur droit du navigateur aligné verticalement) → "À propos de Chrome". 設定_-_Chrome_について.png Le fichier zip sera téléchargé, alors décompressez-le (double-cliquez sur Mac). Copiez le fichier décompressé dans ** un dossier de votre chemin **. «Passer par le chemin» peut être difficile à comprendre, sauf si vous êtes habitué à faire fonctionner le terminal. En termes simples, pour qu'un ordinateur exécute un logiciel, il doit savoir ** où il se trouve **. ** C'est une opération pour que l'ordinateur se souvienne du chemin (= chemin) vers cet endroit **. Pour vérifier l'emplacement de votre PATH sur votre PC, exécutez la commande suivante dans le terminal.

echo $PATH

Vous devriez voir quelque chose comme "/ usr / local / bin" ou "/ usr / bin" (":" est un séparateur de lieu). Vous pouvez le copier quelque part, mais pour l'instant, parcourons le chemin d'accès au dossier Téléchargements dans votre nouvelle maison. Exécutez la commande suivante dans le terminal.

echo 'export PATH=$PATH:~/Downloads' >> ~/.bash_profile
source ~/.bash_profile

Après cela, tapez à nouveau "echo $ PATH" et le dossier Téléchargements sera ajouté à votre PATH. Copiez le pilote Chrome décompressé dans celui-ci. Après cela, entrez "chrome driver" dans le terminal, et si le message suivant apparaît, il est dans votre PATH. tt_—chromedriver—_80×24.png

Installation de la bibliothèque python requise

Installez le sélénium et voyez si le pilote Chrome fonctionne correctement.

#Même contenu que l'article de l'auteur
pip3 install selenium
python3
>>> from selenium import webdriver
>>> driver = webdriver.Chrome()
>>> driver.get("https://www.python.org")
>>> driver.save_screenshot('screenshot.png')
True

True s'affiche et le sélénium a été installé avec succès. Le pilote Chrome semble fonctionner correctement.

Traduisez simplement l'installation de Konnaku

Enfin, installez la traduction Konnaku.

pip3 install Translation-Gummy

Effectuer la traduction

#Même contenu que l'article de l'auteur
python3
>>> from gummy import TranslationGummy
>>> gummy = TranslationGummy(gateway="useless", translator="deepl")
>>> pdfpath = gummy.toPDF(url="https://www.nature.com/articles/ncb0800_500", path="sample.pdf", delete_html=True)
>>> print(pdfpath)

J'ai essayé de traduire, mais j'ai eu une erreur avec "pdf path = gummy.toPDF (url =" https://www.nature.com/articles/ncb0800_500 ", path =" sample.pdf ", delete_html = True)" devenu. venvList_—Google_Chrome_Helper__Renderer__◂_Python—_128×65.png Quand je lis le message d'erreur, il semble qu'il n'y ait pas de package appelé "punkt". "Veuillez utiliser le téléchargeur NLTK" s'affiche, essayez donc de l'exécuter.

import nltk
nltk.download('punkt')
 [nltk_data] Error loading Punkt: <urlopen error [SSL:
 [nltk_data]     CERTIFICATE_VERIFY_FAILED] certificate verify failed

Cependant, j'ai de nouveau une erreur. Une recherche Google pour le message d'erreur a trouvé une solution (NLTK téléchargement SSL: échec de la vérification du certificat). Exécutez la commande suivante sur python3.

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()

Je vais réessayer.

#Même contenu que l'article de l'auteur
python3
>>> from gummy import TranslationGummy
>>> gummy = TranslationGummy(gateway="useless", translator="deepl")
>>> pdfpath = gummy.toPDF(url="https://www.nature.com/articles/ncb0800_500", path="sample.pdf", delete_html=True)
>>> print(pdfpath)
sample.pdf

Cette fois, ça s'est bien passé.

résultat

J'ai pu traduire avec succès! Merveilleux! sample_pdf(1___10ページ).png

Supplément

J'installe Konnaku avec pip, mais il semble que ce n'est pas bon de mélanger l'environnement pip et conda (je ne comprends pas exactement à quel point c'est mauvais. Référence: conda and pip: Danger of mixed //onoz000.hatenablog.com/entry/2018/02/11/142347)). Par conséquent, j'utilise un package appelé ** venv ** pour créer un environnement virtuel pour la traduction Konnaku et l'exécuter sur l'environnement virtuel. venv est livré avec python3 depuis le début.

Créer un environnement virtuel

répertoire mkdir#Création d'un répertoire qui utilise un environnement virtuel
répertoire cd#Déplacer vers un répertoire qui utilise l'environnement virtuel
python3 -m nom de l'environnement virtuel venv

Entrez dans l'environnement virtuel

source Nom de l'environnement virtuel/bin/activate

Recommended Posts

Jusqu'à ce que la personne qui touche le terminal pour la première fois traduise automatiquement le papier en anglais avec "Just Translated Konnaku".
Ce que je suis entré dans Python pour la première fois
Premier Kaggle (kaggle ①)
Kaguru pour la première fois
Voir python pour la première fois
Démarrez Django pour la première fois
Impressions et mémorandum lors de la première utilisation de VScode