"Honkyo Konnaku" ist ein Übersetzungsprogramm für englische Artikel, das von cabernet_rock erstellt wurde. Wenn Sie die URL des Papiers werfen, wird eine PDF-Datei ausgegeben, in der der Originaltext und die japanische Übersetzung parallel sind **, einschließlich der Abbildungen **. Der folgende Artikel fasst zusammen, wie es funktioniert und wie es auf leicht verständliche Weise installiert wird. Es gibt jedoch einige Punkte, die ich installiert habe und die ein wenig verstopft sind, und es gibt einige Hürden für diejenigen, die nicht daran gewöhnt sind, das nasse Hauptterminal zu bedienen. Daher werde ich die Installationsmethode für diejenigen beschreiben, die das Terminal zum ersten Mal öffnen. Essen Sie "japanische Übersetzung Konnaku" und lesen Sie das Papier Verwenden wir "japanische Übersetzung Konnaku".
PC: MacBook Pro 2020 OS: macOS Catalina (10.15.5) shell: zsh (5.7.1)
Da die von Anfang an auf dem Mac installierte Python-Version alt ist (Serie 2), installieren Sie die neueste Version (Serie 3) (Referenz: Python3-Installation (Mac-Version). ..
Laden Sie zunächst die pkg-Datei von der [offiziellen Website] herunter (https://www.python.org/downloads/). Ab dem 4. September 2020 war 3.8.5 die neueste Version. Doppelklicken Sie auf die heruntergeladene pkg-Datei, um sie zu installieren. Grundsätzlich gibt es kein Problem mit "Weiter".
Öffnen Sie ein Terminal, um festzustellen, ob es installiert wurde. Das Terminal befindet sich unter Anwendungen → Dienstprogramme. Wenn das Terminal startet, geben Sie "python3" ein. Wenn die Meldung "Python 3.8.5" angezeigt wird (der Wert variiert hier je nach Version), ist die Installation erfolgreich.
wkhtmltopd ist ein Programm zum Erstellen von PDF aus HTML. Laden Sie den zu Ihrem PC passenden von der offiziellen Download-Site herunter. Doppelklicken Sie auf die heruntergeladene pkg-Datei, um sie zu installieren. Grundsätzlich gibt es kein Problem mit "Weiter". Öffnen Sie nach der Installation ein Terminal und geben Sie den folgenden Befehl ein. Wenn "google.pdf" erstellt wird, ist die Installation erfolgreich.
#Gleicher Inhalt wie der Artikel des Autors
wkhtmltopdf http://google.com google.pdf
ChromeDriver ist ein Google Chrome WebDriver. WebDriver ist die Software, die erforderlich ist, um den Browser programmgesteuert zu betreiben, und es scheint, dass dies bei der Ausgabe des Übersetzungsergebnisses in HTML in der Übersetzung Konnaku erforderlich ist (ich verstehe den Mechanismus hier nicht). Ich denke, andere Browser sind in Ordnung, aber ich werde Google Chrome gemäß dem Artikel des Autors verwenden (wenn Sie kein Goole Chrome haben, installieren Sie es bitte). Siehe: Python + Selenium durchläuft alle automatischen Vorgänge von Chrome
Laden Sie den Chrome-Treiber von der [offiziellen Website] herunter (http://chromedriver.chromium.org/downloads). Bitte beachten Sie, dass Sie ** dieselbe Version ** herunterladen sollten wie das auf Ihrem PC installierte Google Chrome. Sie können die Version von Google Chrome überprüfen, indem Sie auf Einstellungen gehen (ein Symbol mit drei "・" in der oberen rechten Ecke des Browsers, das vertikal ausgerichtet ist) → "Über Chrome". Die Zip-Datei wird heruntergeladen. Entpacken Sie sie (doppelklicken Sie auf den Mac). Kopieren Sie die entpackte Datei in einen Ordner in Ihrem Pfad. "Durch den Pfad gehen" ist möglicherweise schwer zu verstehen, es sei denn, Sie sind an die Bedienung des Terminals gewöhnt. Einfach ausgedrückt, damit ein Computer Software ausführen kann, muss er wissen, wo er sich befindet. ** Es ist eine Operation, bei der sich der Computer den Pfad (= Pfad) zu diesem Ort merkt **. Führen Sie den folgenden Befehl im Terminal aus, um die Position Ihres Pfads auf Ihrem PC zu überprüfen.
echo $PATH
Sie sollten etwas wie "/ usr / local / bin" oder "/ usr / bin" sehen (":" ist ein Ortstrennzeichen). Sie können es irgendwo kopieren, aber hier gehe ich den Pfad zum Download-Ordner in meinem neuen Zuhause durch. Führen Sie den folgenden Befehl im Terminal aus.
echo 'export PATH=$PATH:~/Downloads' >> ~/.bash_profile
source ~/.bash_profile
Geben Sie danach erneut "echo $ PATH" ein und der Ordner "Downloads" wird Ihrem PATH hinzugefügt. Kopieren Sie den entpackten Chrome-Treiber in diesen. Geben Sie danach "Chrome-Treiber" in das Terminal ein. Wenn die folgende Meldung angezeigt wird, befindet sie sich in Ihrem PFAD.
Installieren Sie Selen und prüfen Sie, ob der Chrome-Treiber ordnungsgemäß funktioniert.
#Gleicher Inhalt wie der Artikel des Autors
pip3 install selenium
python3
>>> from selenium import webdriver
>>> driver = webdriver.Chrome()
>>> driver.get("https://www.python.org")
>>> driver.save_screenshot('screenshot.png')
True
True wird angezeigt und Selen wurde erfolgreich installiert. Chrome Driver scheint gut zu funktionieren.
Installieren Sie abschließend die Übersetzung Konnaku.
pip3 install Translation-Gummy
#Gleicher Inhalt wie der Artikel des Autors
python3
>>> from gummy import TranslationGummy
>>> gummy = TranslationGummy(gateway="useless", translator="deepl")
>>> pdfpath = gummy.toPDF(url="https://www.nature.com/articles/ncb0800_500", path="sample.pdf", delete_html=True)
>>> print(pdfpath)
Ich habe versucht zu übersetzen, aber ich habe eine Fehlermeldung mit "pdf path = gummy.toPDF (url =" https://www.nature.com/articles/ncb0800_500 ", path =" sample.pdf ", delete_html = True)" erhalten. wurde. Wenn ich die Fehlermeldung lese, scheint es kein Paket namens "punkt" zu geben. "Bitte verwenden Sie den NLTK-Downloader" wird angezeigt. Versuchen Sie es also.
import nltk
nltk.download('punkt')
[nltk_data] Error loading Punkt: <urlopen error [SSL:
[nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed
Ich habe jedoch wieder einen Fehler erhalten. Eine Google-Suche nach der Fehlermeldung hat eine Lösung gefunden (NLTK-Download SSL: Zertifikatsüberprüfung fehlgeschlagen). Führen Sie den folgenden Befehl auf python3 aus.
import nltk
import ssl
try:
_create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
pass
else:
ssl._create_default_https_context = _create_unverified_https_context
nltk.download()
Ich werde es nochmal versuchen.
#Gleicher Inhalt wie der Artikel des Autors
python3
>>> from gummy import TranslationGummy
>>> gummy = TranslationGummy(gateway="useless", translator="deepl")
>>> pdfpath = gummy.toPDF(url="https://www.nature.com/articles/ncb0800_500", path="sample.pdf", delete_html=True)
>>> print(pdfpath)
sample.pdf
Diesmal lief es gut.
Ich konnte erfolgreich übersetzen! Wunderbar!
Ich installiere Konnaku mit pip, aber es scheint nicht gut zu sein, die Umgebung von pip und conda zu mischen (ich verstehe nicht genau, wie schlecht es ist. Referenz: conda und pip: Gefahr des Mischens //onoz000.hatenablog.com/entry/2018/02/11/142347)). Daher verwende ich ein Paket namens ** venv **, um eine virtuelle Umgebung für die Übersetzung von Konnaku zu erstellen und in der virtuellen Umgebung auszuführen. venv kommt von anfang an mit python3.
Erstellen einer virtuellen Umgebung
mkdir-Verzeichnis#Erstellen eines Verzeichnisses, das eine virtuelle Umgebung verwendet
CD-Verzeichnis#Wechseln Sie in ein Verzeichnis, das die virtuelle Umgebung verwendet
python3 -m Name der virtuellen Umgebung
Betreten Sie die virtuelle Umgebung
Quelle Name der virtuellen Umgebung/bin/activate
Recommended Posts