Grattage avec Python

J'ai dû le gratter en Python, alors notez-le. Préparez l'environnement avec Docker et implémentez-le.

Constitution


$ ls
README.md  docker-compose.yaml  scraping
$ ls scraping/
Dockerfile  requirements.txt  scrap.py  scraping.py

docker-compose.yaml


version: '3.8'

services:
  scraping:
    build: ./scraping

Dockerfile


FROM python:latest

COPY . /work
WORKDIR /work

RUN apt-get update

#Installez une belle soupe
RUN pip install -U pip
RUN pip install -r requirements.txt

ENTRYPOINT ["python"]
CMD ["scrap.py"]

requirements.txt


bs4
requests

Obtenez-le avec h1

scrap.py


import requests
from bs4 import BeautifulSoup

url = "https://www.yahoo.co.jp"
response = requests.get(url)

soup = BeautifulSoup(response.text,"html.parser")

titles = soup.find_all("h1")

for title in titles:
    print(title.text)

Résultat d'exécution


$ docker-compose up --build
.
.
.
scraping_1  | Yahoo! JAPAN
scraping_1  |Chercher
scraping_1  |À propos des paramètres JavaScript
scraping_1  |À propos des navigateurs recommandés
scraping_1  |Remarquer
scraping_1  |Principaux services
scraping_1  |nouvelles
scraping_1  |Actualités majeures
scraping_1  |Sa Majesté l'Empereur "Deep Reflection" Cette année également
scraping_1  |Une histoire d'amour sur un champ de bataille solitaire
scraping_1  |5000 morts sans combattre une île abandonnée
scraping_1  |Méfiez-vous de la chaleur catastrophique l'après-midi
scraping_1  |Ancien recruteur "Japon et efforts"
scraping_1  |Achat de timbres Lawson fond rampant
scraping_1  |Match d'échange de nouvelles de dernière heure Iwaki vs.Kokushikan
scraping_1  |Shoshosha termine l'été sans perdre
scraping_1  |Silence au service commémoratif
scraping_1  |Informations sur les individus
scraping_1  |Votre statut
scraping_1  |La date d'aujourd'hui
b-model_scraping_1 exited with code 0

Recommended Posts

Grattage avec Python
Grattage avec Python
Grattage en Python (préparation)
Essayez de gratter avec Python.
Grattage avec Python + PhantomJS
Grattage avec du sélénium [Python]
Scraping avec Python + PyQuery
Scraping RSS avec Python
[Scraping] Scraping Python
J'ai essayé de gratter avec Python
Web scraping avec python + JupyterLab
Grattage au sélénium en Python
Grattage avec Selenium + Python Partie 1
Grattage avec chromedriver en python
Grattage festif avec Python, scrapy
Grattage avec du sélénium en Python
Grattage avec Tor en Python
Scraping prévisions météorologiques avec python
Grattage avec Selenium + Python Partie 2
J'ai essayé de gratter avec du python
Web scraping débutant avec python
Mémo de raclage Python
Grattage au sélénium
Essayez de gratter avec Python + Beautiful Soup
Grattage au sélénium ~ 2 ~
Statistiques avec python
Scraping avec Node, Ruby et Python
Scraping avec Selenium en Python (Basic)
Python avec Go
Grattage avec Python, Selenium et Chromedriver
Web scraping avec Python Première étape
J'ai essayé webScraping avec python.
Grattage avec Python et belle soupe
Twilio avec Python
Intégrer avec Python
Python racle eBay
Jouez avec 2016-Python
AES256 avec python
Testé avec Python
Grattage avec du sélénium
python commence par ()
Grattage Python get_title
avec syntaxe (Python)
Faisons du scraping d'images avec Python
Python: grattage partie 1
Obtenez les tendances Qiita avec le scraping Python
Bingo avec python
Zundokokiyoshi avec python
Mémo d'apprentissage "Scraping & Machine Learning avec Python"
Scraping à l'aide de Python
Obtenez des informations météorologiques avec Python et le grattage
Excel avec Python
Micro-ordinateur avec Python
Python: grattage, partie 2
Cast avec python
Obtenez des informations sur la propriété en grattant avec python
Grattage WEB avec Python (pour mémo personnel)
Automatisez des tâches simples avec Python Part1 Scraping
Premiers pas avec Python Web Scraping Practice