Was tun, wenn aufgrund der Proxy-Einstellungen in Python Web Scraping keine Antwort erfolgt?

Notieren Sie sich, was zu tun ist, wenn beim Versuch, ein Programm zu erstellen, das automatisch die für das Scraping mit Python erforderlichen Webinformationen extrahiert, ein Fehler auftritt.

Ich habe versucht, ein Web-Scraping-Programm mit Pythons Urllib und Beautifulsoup zu erstellen. Ich habe jedoch eine Fehlermeldung erhalten (eine Meldung wie die folgende), dass die erste urllib.request.urlopen (...) nicht geantwortet hat.

"Die Verbindung konnte nicht hergestellt werden, da sie nach einer bestimmten Zeit nicht richtig reagiert hat." *

Es scheint, dass die Kommunikation aufgrund des Vorhandenseins des Proxyservers nicht hergestellt wurde. Der Proxy war im Internet Explorer wie folgt.

[Extras] -> [Internetoptionen] -> [Verbindungen] -> [LAN-Einstellungen]
[x] Verwenden Sie ein automatisches Konfigurationsskript

Das automatische Konfigurationsskript war http://proxy.-----.co.jp/proxy.pac. (----- ist nicht die tatsächliche, es ist in der Lücke.)

Vor urlopen habe ich es gelöst, indem ich ProxyHandler für urllib.request vorbereitet, in build_opener festgelegt und build_opener installiert habe.

Der Beispielcode ist unten.

`scrapetest.py`


import urllib.request
proxies ={'http':'http://proxy.-----.co.jp/proxy.pac'}
proxy_handler = urllib.request.ProxyHandler(proxies)
opener = urllib.request.build_opener(proxy_handler)
urllib.request.install_opener(opener)
html = urllib.request.urelopen("http://wwww.pythonscraping.com/pages/page1.html")
print(html.read())

Die Entwicklungsumgebung ist Python 3.5.2 von Anaconda unter Windows.

Weitere Informationen zum Programmieren von Web-Scraping finden Sie im folgenden Buch. Web Scraping mit Python (O'Reilly)

Recommended Posts

Was tun, wenn aufgrund der Proxy-Einstellungen in Python Web Scraping keine Antwort erfolgt?

Was tun, wenn ModuleNotFoundError: In Python tritt kein Modul mit dem Namen 'XXX' auf

Was tun, wenn der Werttyp in Python nicht eindeutig ist?

Was tun, wenn in python json .dumps eine Dezimalstelle enthalten ist?

Was tun, wenn [Errno 2] in Python keine solche Datei oder kein solches Verzeichnis angezeigt wird?

[Python] Was tun, wenn beim Erstellen von Exe mit PyInstaller kein Modul mit dem Namen "pyproj.datadir" angezeigt wird?

Was tun, wenn in Python "SSL: CERTIFICATE_VERIFY_FAILED _ssl.c: 1056" angezeigt wird?

In Python gibt es keinen Schalter

NameError: Der globale Name'dot_parser 'ist nicht definiert und was ist zu tun, wenn er in Python angezeigt wird?

Was tun, wenn in pydoc keine Python-Dokumentation für ... gefunden wird?

[Python] Was tun, wenn ein Fehler im Zusammenhang mit der SSL-Authentifizierung zurückgegeben wird?

Was tun, wenn in der Anaconda-Umgebung die Warnung "Die Umgebung ist konsistent ..." angezeigt wird

Was tun, wenn eine Warnmeldung in der Pip-Liste angezeigt wird?

[Python] Was tun, wenn beim Importieren aus dem zu sys.path hinzugefügten Verzeichnis gegen PEP8 verstoßen wird?

So schreiben Sie, was zu tun ist, wenn die Anwendung zum ersten Mal in Qt for Python mit Designer angezeigt wird

Was tun, um eine Google-Tabelle in Python zu erhalten?

Was tun, wenn eine Warnung zur Python-Integration in Neovims CheckHealth angezeigt wird?

Was tun, wenn bei der Eingabe eines Kameravideos in OpenCV ein Abbruch angezeigt wird?

Was beim Nachahmen zu tun ist, wird in Python eingebettet

[openpyxl] Was tun, wenn IllegalCharacterError in pandas.DataFrame.to_excel angezeigt wird?

curl: (60) Was tun, wenn das Ausstellerzertifikat ungültig ist?

Was tun, wenn "Name xxx nicht importiert werden kann" [Python]

Ich kann keine Pipenv-Shell verwenden ... was soll ich tun?

Ich möchte am Ende etwas mit Python machen

[Python] Typ Fehler: 'WebElement'-Objekt ist nicht iterierbar Was tun, wenn ein Fehler auftritt?

Was zu tun ist, wenn es nicht in der Sudoers-Datei enthalten ist. Dieser Vorfall wird gemeldet.

Was tun, wenn in Hydrogen "Kein Kernel für Sprachpython gefunden" angezeigt wird?

Was tun, wenn nur das Fenster angezeigt wird und im Pygame nichts angezeigt wird?

Was tun, wenn beim Importieren von matplotlib in Python (Mac) eine Fehlermeldung angezeigt wird?

Was tun, wenn der Fortschrittsbalken in tqdm von Python nicht angezeigt wird?

Was tun, wenn Pythons IntelliSense in VS Code unter Windows nicht angezeigt wird?

Was tun, wenn `Argumente [0] .scrollIntoView ();` in Python-Selen fehlschlägt?

Verfahren, die durchgeführt werden müssen, wenn Japanisch nicht in matplotlib angezeigt wird

Was tun, wenn ein nicht in pom.xml definiertes Glas zu einem fehlenden Artefakt wird?

Was tun, wenn Swagger-Codegen mit Python und Importfehler ausgeführt wird? Es wird kein Modul mit dem Namen angezeigt

Was tun, wenn in Django "Ungültiger HTTP_HOST-Header" angezeigt wird?

Wenn in python3 manage.py makemigrations "Keine Änderungen erkannt" angezeigt wird

ImportError: Kein Modul Was tun, wenn Sie dazu aufgefordert werden?

Was tun, wenn der Werttyp in Python nicht eindeutig ist?

Was tun, wenn in python json .dumps eine Dezimalstelle enthalten ist?

Was ist "Mahjong" in der Python-Bibliothek? ??

Was ist im Docker Python-Image pfeifend?

Was zu tun ist, wenn es nicht in der Sudoers-Datei enthalten ist. Dieser Vorfall wird gemeldet.

Was tun, wenn der Fortschrittsbalken in tqdm von Python nicht angezeigt wird?

Lösen Sie einen Strich (Backtrack ohne Rekursion in Python)

Was tun, wenn aufgrund der Proxy-Einstellungen in Python Web Scraping keine Antwort erfolgt?

Was tun, wenn im Chrome-Webtreiber (Selenium) die Fehlermeldung "Beim Anzeigen dieser Webseite ist ein Problem aufgetreten" angezeigt wird?

Was tun, wenn Sie "locale.Error: nicht unterstützte Gebietsschemaeinstellung" erhalten, wenn Sie den Tag vom Datum in Python abrufen?

Beim Zusammenführen per Pull-Anforderung enthält die Antwort der Github-API keine Committer-Informationen

Was tun, wenn beim Ausführen von Python eine Warnung zur unsicheren Plattform angezeigt wird?

Was tun, wenn "Unbenannt: 0" in_csv-> read_csv von Pandas hinzugefügt wird?

Was tun, wenn UnicodeDecodeError während read_csv in Pandas auftritt (pd.read_table ())

Was tun mit PYTHON Release?

[Mac OS] Was tun, wenn Python nicht als Framework installiert ist? Wird angezeigt, wenn der Import von matplot lib ausgeführt wird.

Was tun, wenn PyInstaller3.5 einen Fehler in Python3.8 verursacht (TypeError: Eine Ganzzahl ist erforderlich (Typbytes erhalten))

Was tun, wenn Sie die Rastersuche von sklearn in Python nicht verwenden können?

So schreiben Sie eine Zeichenfolge, wenn Python mehrere Zeilen enthält

Bei der Ausgabe einer INSERT-Anweisung in Python wird keine solche Spalte angezeigt

Was soll ich verwenden, um Typvergleiche in Python durchzuführen?