Web Scraping mit Python + JupyterLab

Einführung

"JupyterLab" ist eine Ausführungsumgebung, in der Sie "Python" leicht berühren können.

Umgebung

git clone https://github.com/takiguchi-yu/python-jupyterLab.git
cd python-jupyterLab

Starten Sie JupyterLab

docker-compose up -d

Zugriff

http://localhost:8888

初期画面

JupyterLab fertig

docker-compose down

Web-Scraping-Beispiel

Lassen Sie uns ein wenig Web Scraping schreiben. Ein Beispiel, das die in der externen Datei beschriebene URL liest und das Ergebnis in die externe Datei ausgibt, während es darauf trifft. Webスクレイピング実装

from bs4 import BeautifulSoup
import requests
headers = {
    'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 12_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.0 Mobile/15E148 Safari/604.1'
}
print('Starten Sie die Verarbeitung')
#Liste der URLs(Externe Datei)Lesen
with open('./input_urls.txt', mode='r', encoding='utf-8') as f:
    for url in f:
        result = requests.get(url.rstrip('\n'), headers=headers) #Hinweis: Entfernen Sie den Zeilenvorschubcode
        print(result.status_code)
        soup = BeautifulSoup(result.content, 'html.parser')
        a = soup.find_all('HTML-Tag-Name hier', {'class': 'Klassenname hier'})
        #a = soup.find_all('div', {'class': 'hoge-hoge'})  #Beispiel
        b = a[0].find(text=True) #Holen Sie sich den Text des HTML-Tags
        #Externe Datei mit Scraping-Ergebnissen(output.txt)Ausgabe an
        with open('./output.txt', 'a') as f:
            print(b, file=f)
print('Bearbeitung abgeschlossen')

Sie können auch das Terminal verwenden

Sie können Ihre Lieblingsbibliothek frei ablegen

ターミナル1 ターミナル2

Informationen zum Aufbau der Umgebung finden Sie im Folgenden

https://qiita.com/hgaiji/items/edf71435d0565257f980

Recommended Posts

Web Scraping mit Python + JupyterLab
Web Scraping Anfänger mit Python
Scraping mit Python
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Scraping in Python (Vorbereitung)
Versuchen Sie es mit Python.
WEB-Scraping mit Python (für persönliche Notizen)
Erste Schritte mit Python Web Scraping Practice
Scraping mit Python + PhantomJS
[Persönlicher Hinweis] Scraping von Webseiten in Python3
Pferderennseite Web Scraping mit Python
Erste Schritte mit Python Web Scraping Practice
Schaben mit Selen [Python]
Üben des Web-Scrapings mit Python und Selen
Scraping mit Python + PyQuery
Einfaches Web-Scraping mit Python und Ruby
Scraping von RSS mit Python
[Für Anfänger] Versuchen Sie Web Scraping mit Python
Führen Sie das WEB-Scraping regelmäßig mit AWS-Lambda + Python + Cron aus
Web Scraping mit Python (Wettervorhersage)
Web Scraping mit Python (Aktienkurs)
Ich habe versucht, mit Python zu kratzen
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Schaben mit Chromedriver in Python
Festliches Scraping mit Python, Scrapy
Speichern Sie Bilder mit Web Scraping
Scraping mit Selen in Python
Einfaches Web-Scraping mit Scrapy
Scraping mit Tor in Python
Web-API mit Python + Falcon
Web Scraping mit Selenium (Python)
Kratzwettervorhersage mit Python
Schaben mit Selen + Python Teil 2
Webanwendung mit Python + Flask ② ③
Ich habe versucht, mit Python zu kratzen
Optimieren Sie die Websuche mit Python
Webanwendung mit Python + Flask ④
Datenanalyse zur Verbesserung von POG 1 ~ Web Scraping mit Python ~
Schnelles Web-Scraping mit Python (unterstützt das Laden von JavaScript)
[Scraping] Python-Scraping
Python-Anfänger bleiben beim ersten Web-Scraping stecken
Web Scraping
Versuchen Sie es mit Python + Beautiful Soup
Scraping mit Node, Ruby und Python
Scraping mit Selen in Python (Basic)
Scraping mit Python, Selen und Chromedriver
Erste Schritte mit Python-Webanwendungen
Scraping von Alexas Web Rank mit pyQuery
Kratzen mit Python und schöner Suppe
Überwachen Sie Python-Webanwendungen mit Prometheus
Holen Sie sich Web-Screen-Capture mit Python
Lassen Sie uns mit Python Image Scraping durchführen
Holen Sie sich Qiita-Trends mit Python-Scraping
Web Scraping für Anfänger in Python (1)