Wie der Titel schon sagt. Selbst wenn ich ziemlich viel gegoogelt habe, konnte ich keine Lösung auf Japanisch oder Englisch finden. Machen Sie sich also eine Notiz, damit ich im Falle einer Wiederholung darauf zurückgreifen kann
Es ist eigentlich nicht Wikipedia, aber es ist passiert, als ich die https: // ~
Seite abgekratzt habe.
Wenn Sie jetzt den PC berühren, können Sie die Site ohne Fehler kratzen. Warum ... ein Umweltproblem?
import requests
url = 'https://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8'
response = requests.get(url)
result = response.text
print(result)
Ich habe die Fehlermeldung zu diesem Zeitpunkt noch nicht aufgeschrieben, aber ich erinnere mich, dass das Wort "schlechter Handschlag" in "SSLError" enthalten war.
Ich wollte die Strategie "verify = False" nicht verwenden, daher habe ich viel recherchiert und festgestellt, dass ich mit "urllib" und "ssl" fehlerfrei kratzen konnte. Sobald Sie hier angekommen sind, müssen Sie nur noch die Elemente extrahieren, die Sie mit Beautiful Soup 4 verwenden möchten.
import urllib.request
import ssl
url = 'https://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8'
context = ssl.SSLContext()
req = urllib.request.Request(url=url)
with urllib.request.urlopen(req, context=context) as f:
result = f.read().decode()
print(result)
Recommended Posts