J'ai dû le gratter en Python, alors notez-le. Préparez l'environnement avec Docker et implémentez-le.
Constitution
$ ls
README.md docker-compose.yaml scraping
$ ls scraping/
Dockerfile requirements.txt scrap.py scraping.py
docker-compose.yaml
version: '3.8'
services:
scraping:
build: ./scraping
Dockerfile
FROM python:latest
COPY . /work
WORKDIR /work
RUN apt-get update
#Installez une belle soupe
RUN pip install -U pip
RUN pip install -r requirements.txt
ENTRYPOINT ["python"]
CMD ["scrap.py"]
requirements.txt
bs4
requests
Obtenez-le avec h1
scrap.py
import requests
from bs4 import BeautifulSoup
url = "https://www.yahoo.co.jp"
response = requests.get(url)
soup = BeautifulSoup(response.text,"html.parser")
titles = soup.find_all("h1")
for title in titles:
print(title.text)
Résultat d'exécution
$ docker-compose up --build
.
.
.
scraping_1 | Yahoo! JAPAN
scraping_1 |Chercher
scraping_1 |À propos des paramètres JavaScript
scraping_1 |À propos des navigateurs recommandés
scraping_1 |Remarquer
scraping_1 |Principaux services
scraping_1 |nouvelles
scraping_1 |Actualités majeures
scraping_1 |Sa Majesté l'Empereur "Deep Reflection" Cette année également
scraping_1 |Une histoire d'amour sur un champ de bataille solitaire
scraping_1 |5000 morts sans combattre une île abandonnée
scraping_1 |Méfiez-vous de la chaleur catastrophique l'après-midi
scraping_1 |Ancien recruteur "Japon et efforts"
scraping_1 |Achat de timbres Lawson fond rampant
scraping_1 |Match d'échange de nouvelles de dernière heure Iwaki vs.Kokushikan
scraping_1 |Shoshosha termine l'été sans perdre
scraping_1 |Silence au service commémoratif
scraping_1 |Informations sur les individus
scraping_1 |Votre statut
scraping_1 |La date d'aujourd'hui
b-model_scraping_1 exited with code 0
Recommended Posts