Dies wird verwendet, wenn Sie ein Papier aus dem PDF-Format kopieren, einfügen und in Google übersetzen möchten. Öffnen Sie die Ausgabe conv.html und klicken Sie mit der rechten Maustaste, um sie zu übersetzen. Ich brauchte es in Eile, also machte ich es wahnsinnig passend. Es gibt keine Wartungspläne.
"""
Dies wird verwendet, wenn Sie ein Papier aus dem PDF-Format kopieren, einfügen und in Google übersetzen möchten.
.Angesichts des Pfades von txt_conv.Da es als HTML ausgegeben wird, öffnen Sie es mit Chrome und klicken Sie mit der rechten Maustaste, um es zu übersetzen.
· Was machst du
Strg im PDF+Wenn Sie es mit A einfügen, werden die Zeilenumbrüche verschwendet und es wird nicht gut übersetzt.
Vermeide es.
"""
import sys
import os
filepath = sys.argv[1]
# ---Verarbeiten Sie Text für die Google-Übersetzung
with open(filepath, "r", encoding="utf-8") as f:
lines = f.readlines()
newlines = []
lenbuf = [] #Zeilenlänge Puffer
for line in lines:
if len(line) >= 2:
if line[-2] == ".": #Fügen Sie einen Zeilenumbruch ein, wenn das Ende ein Punkt ist
line = line[:-1] + "<br>"
else: #Wenn nicht, setzen Sie ein Leerzeichen
line = line[:-1] + " "
newlines.append(line)
lenbuf.append(len(line))
f.close()
# ---Wenn es besser ist, einen Zeilenumbruch einzufügen, fügen Sie einen Zeilenumbruch ein(durchschnittliche Leitungslänge*0.Stellen Sie 8 als Schwellenwert ein)
ave_len = sum(lenbuf) / len(lenbuf)
for n, linelen in enumerate(lenbuf):
if linelen < ave_len * 0.8:
newlines[n] = newlines[n] + "<br>"
# ---_Speichern Sie mit conv
savepath = os.path.splitext(filepath)[0] + "_conv.html"
with open(savepath, "w", encoding="utf-8") as f:
f.writelines(newlines)
Recommended Posts