Probieren Sie Python aus, an dem Sie interessiert waren. Die Umgebung ist Windows 10.
Anaconda3 Python-Distribution. Sie können DL mit Python alleine, aber wenn Sie ein wenig aussehen Anaconda3, das bereits häufig verwendete Bibliotheken enthält, schien besser zu sein, also werde ich es hier einfügen. Ich habe das folgende 64-Bit-Grafikinstallationsprogramm (466 MB) heruntergeladen und alles standardmäßig installiert. https://www.anaconda.com/products/individual
Fügen Sie nach der Installation den Speicherort der Binärdatei zu den Umgebungsvariablen hinzu. C:\Users\xxxxxx\anaconda3
VS code Suche nach VS-Code und Download. Fügen Sie nach der Installation Folgendes aus der Erweiterung im linken Menü hinzu.
Wenn Sie die Version anzeigen können, indem Sie den folgenden Befehl an der Eingabeaufforderung eingeben, ist die Umgebungseinstellung abgeschlossen.
python
C:\Users\xxxxxx> python -V
Python 3.8.3
Erstellen Sie ein Testverzeichnis und erstellen Sie darin eine "test.py" -ähnliche Datei.
test.py
print("test!!")
Wählen Sie in der Ansicht "Terminal", um das Terminal anzuzeigen. Führen Sie den folgenden Befehl aus, da PowerShell im Verzeichnis der geöffneten Py-Datei gestartet wird. Dann wird "test !!" angezeigt.
powershell
PS C:\Users\xxxxx\workspace\test> python test.py
test!!
Versuchen Sie es mit Schaben. Schöne Suppe scheint nützlich zu sein. ** Überprüfen Sie vor dem Scraping unbedingt robots.txt und die Nutzungsbedingungen, um festzustellen, ob sie zulässig sind! !! ** **.
test.py
import requests
import pandas as pd
from bs4 import BeautifulSoup
#URL zum Kratzen
url = 'xxxxxxxx'
response = requests.get(url)
response.encoding = response.apparent_encoding
#In ein BeautifulSoup-Objekt konvertieren
bs = BeautifulSoup(response.text, 'html.parser')
#Rufen Sie das im Klassenattribut angegebene h2-Tag mit class123 ab
tags = bs.find_all('h2', attrs={'class': 'class123'})
for tag in tags:
print(tag,end='\n')
Wenn Sie eine Fehlermeldung wie "numpy not found" erhalten, fehlt der Pfad. Fügen Sie der Umgebungsvariablen das folgende Bibliotheksverzeichnis hinzu und starten Sie VScode neu. C:\Users\xxxxx\anaconda3\Library\bin
Das Schaben war viel einfacher als Javascript.
Recommended Posts