Wie unten gezeigt, wird das Logo auf der oberen Seite der Google-Suche in Text konvertiert und in HTML angezeigt.
↓
Mit dieser Methode können Sie im Internet veröffentlichte englische Bücher im Bildformat in HTML kompilieren und mithilfe der Seitenübersetzungsfunktion von Chrome zum Lesen ins Japanische übersetzen.
bash
#Für Schritt 1
pip install beautifulsoup4
#Für Schritt 2
brew install tesseract
pip install pyocr
#Für Schritt 3
pip install jinja2
** Schritt 1: Logo herunterladen **
python
import requests
from bs4 import BeautifulSoup
#Holen Sie sich HTML
url = 'https://www.google.com'
res = requests.get(url)
soup = BeautifulSoup(res.text, 'html.parser')
#Bild extrahieren
img = soup.find('img', {'id': 'hplogo'})
#URL für Bild erstellen
img_url = 'https://www.google.com' + img['src']
#Bild herunterladen
r = requests.get(img_url)
#Bild speichern
with open('hplogo.jpg' ,'wb') as file:
file.write(r.content)
** Schritt 2: Konvertieren Sie das Logo-Bild mit OCR in Text **
python
from PIL import Image
import pyocr
import pyocr.builders
#Voreinstellung 1
tools = pyocr.get_available_tools()
tool = tools[0]
#Voreinstellung 2
builder = pyocr.builders.TextBuilder()
#Bild laden
img = Image.open('hplogo.jpg')
#Führen Sie OCR aus
result = tool.image_to_string(img, builder=builder)
** Schritt 3: Text in HTML anzeigen **
python
from jinja2 import Template
#Ansicht generieren
html = '''
<!DOCTYPE html>
<html lang="en">
<head>
<title>The Farther Reaches Of Human Nature</title>
</head>
<body>
<h1>{{ result }}</h1>
</body>
</html>
'''
template = Template(html)
data = { 'result': result }
view = template.render(data)
#sparen
with open('hplogo.html', 'w', encoding='utf-8') as f:
f.write(view)
Wenn Sie die generierte hplogo.html
in Ihrem Browser öffnen, sollte der Text "Google" wie unten gezeigt angezeigt werden. (Bild neu posten)
Schöne Suppe in 10 Minuten - Qiita Lassen Sie uns mit Python - Qiita Bilder kratzen Ausführen von OCR mit Python | Gammasoft Co., Ltd. Ich möchte zum ersten Mal seit einiger Zeit HTML in Python ausgeben. Überprüfen Sie daher die Vorlage --Qiita
Recommended Posts