Scraping mit Python

Ich musste es in Python kratzen, also notiere es dir. Bereiten Sie die Umgebung mit Docker vor und implementieren Sie sie.

Verfassung


$ ls
README.md  docker-compose.yaml  scraping
$ ls scraping/
Dockerfile  requirements.txt  scrap.py  scraping.py

docker-compose.yaml


version: '3.8'

services:
  scraping:
    build: ./scraping

Dockerfile


FROM python:latest

COPY . /work
WORKDIR /work

RUN apt-get update

#Installieren Sie schöne Suppe
RUN pip install -U pip
RUN pip install -r requirements.txt

ENTRYPOINT ["python"]
CMD ["scrap.py"]

requirements.txt


bs4
requests

Hol es dir mit h1

scrap.py


import requests
from bs4 import BeautifulSoup

url = "https://www.yahoo.co.jp"
response = requests.get(url)

soup = BeautifulSoup(response.text,"html.parser")

titles = soup.find_all("h1")

for title in titles:
    print(title.text)

Ausführungsergebnis


$ docker-compose up --build
.
.
.
scraping_1  | Yahoo! JAPAN
scraping_1  |Suche
scraping_1  |Informationen zu JavaScript-Einstellungen
scraping_1  |Über empfohlene Browser
scraping_1  |Beachten
scraping_1  |Hauptdienste
scraping_1  |Nachrichten
scraping_1  |Wichtige Neuigkeiten
scraping_1  |Seine Majestät der Kaiser "Deep Reflection" auch dieses Jahr
scraping_1  |Eine Liebesgeschichte von einem einsamen Schlachtfeld
scraping_1  |5000 Tote ohne eine verlassene Insel zu bekämpfen
scraping_1  |Seien Sie vorsichtig bei Katastrophenhitze am Nachmittag
scraping_1  |Ehemaliger Rekrutierungsarbeiter "Japan und Bemühungen"
scraping_1  |Lawson Briefmarkenkauf zügelloser Hintergrund
scraping_1  |Breaking News Exchange Match Iwaki vs..Kokushikan
scraping_1  |Shoshosha beendet den Sommer ohne zu verlieren
scraping_1  |Schweigen beim Gedenkgottesdienst
scraping_1  |Informationen über Personen
scraping_1  |Dein Status
scraping_1  |Heutiges Datum
b-model_scraping_1 exited with code 0

Recommended Posts

Scraping mit Python
Scraping mit Python
Scraping in Python (Vorbereitung)
Versuchen Sie es mit Python.
Scraping mit Python + PhantomJS
Schaben mit Selen [Python]
Scraping mit Python + PyQuery
Scraping von RSS mit Python
[Scraping] Python-Scraping
Ich habe versucht, mit Python zu kratzen
Web Scraping mit Python + JupyterLab
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Schaben mit Chromedriver in Python
Festliches Scraping mit Python, Scrapy
Scraping mit Selen in Python
Scraping mit Tor in Python
Kratzwettervorhersage mit Python
Schaben mit Selen + Python Teil 2
Ich habe versucht, mit Python zu kratzen
Web Scraping Anfänger mit Python
Python-Scraping-Memo
Schaben mit Selen
Versuchen Sie es mit Python + Beautiful Soup
Schaben mit Selen ~ 2 ~
Statistik mit Python
Scraping mit Node, Ruby und Python
Scraping mit Selen in Python (Basic)
Python mit Go
Scraping mit Python, Selen und Chromedriver
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Kratzen mit Python und schöner Suppe
Twilio mit Python
In Python integrieren
Python Scraping eBay
Spielen Sie mit 2016-Python
AES256 mit Python
Getestet mit Python
Schaben mit Selen
Python beginnt mit ()
Python Scraping get_title
mit Syntax (Python)
Lassen Sie uns mit Python Image Scraping durchführen
Python: Scraping Teil 1
Holen Sie sich Qiita-Trends mit Python-Scraping
Bingo mit Python
Zundokokiyoshi mit Python
"Scraping & maschinelles Lernen mit Python" Lernnotiz
Scraping mit Python
Holen Sie sich Wetterinformationen mit Python & Scraping
Excel mit Python
Mikrocomputer mit Python
Python: Scraping Teil 2
Mit Python besetzen
Abrufen von Eigenschaftsinformationen durch Scraping mit Python
WEB-Scraping mit Python (für persönliche Notizen)
Automatisieren Sie einfache Aufgaben mit Python Part1 Scraping
Erste Schritte mit Python Web Scraping Practice