Web scraping avec python + JupyterLab

introduction

JupyterLab est un environnement d'exécution dans lequel vous pouvez facilement toucher python.

Environnement

git clone https://github.com/takiguchi-yu/python-jupyterLab.git
cd python-jupyterLab

Démarrez JupyterLab

docker-compose up -d

accès

http://localhost:8888

初期画面

JupyterLab terminé

docker-compose down

Exemple de scraping Web

Écrivons un peu de web scraping. Un exemple qui lit l'URL décrite dans le fichier externe et renvoie le résultat dans le fichier externe tout en le frappant. Webスクレイピング実装

from bs4 import BeautifulSoup
import requests
headers = {
    'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 12_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.0 Mobile/15E148 Safari/604.1'
}
print('Commencer le traitement')
#Liste des URL(Fichier externe)Lis
with open('./input_urls.txt', mode='r', encoding='utf-8') as f:
    for url in f:
        result = requests.get(url.rstrip('\n'), headers=headers) #Remarque: supprimez le code de saut de ligne
        print(result.status_code)
        soup = BeautifulSoup(result.content, 'html.parser')
        a = soup.find_all('Nom de la balise HTML ici', {'class': 'Nom de la classe ici'})
        #a = soup.find_all('div', {'class': 'hoge-hoge'})  #Exemple
        b = a[0].find(text=True) #Récupérez le texte de la balise HTML
        #Fichier externe des résultats de scraping(output.txt)Sortie vers
        with open('./output.txt', 'a') as f:
            print(b, file=f)
print('Traitement terminé')

Vous pouvez également utiliser le terminal

Vous pouvez librement mettre dans votre bibliothèque préférée

ターミナル1 ターミナル2

Reportez-vous à ce qui suit pour la construction de l'environnement

https://qiita.com/hgaiji/items/edf71435d0565257f980

Recommended Posts

Web scraping avec python + JupyterLab
Web scraping débutant avec python
Grattage avec Python
Web scraping avec Python Première étape
J'ai essayé webScraping avec python.
Grattage en Python (préparation)
Essayez de gratter avec Python.
Grattage WEB avec Python (pour mémo personnel)
Premiers pas avec Python Web Scraping Practice
Grattage avec Python + PhantomJS
[Note personnelle] Scraping de pages Web en python3
Site de courses de chevaux Web scraping avec Python
Premiers pas avec Python Web Scraping Practice
Grattage avec du sélénium [Python]
Pratiquer le web scraping avec Python et Selenium
Scraping avec Python + PyQuery
Scraping Web facile avec Python et Ruby
Scraping RSS avec Python
[Pour les débutants] Essayez le web scraping avec Python
Exécutez régulièrement le scraping WEB avec AWS-Lambda + Python + Cron
Web scraping avec Python (prévisions météo)
Web scraping avec Python (cours de l'action)
J'ai essayé de gratter avec Python
Grattage au sélénium en Python
Grattage avec Selenium + Python Partie 1
Grattage avec chromedriver en python
Grattage festif avec Python, scrapy
Enregistrez des images avec le web scraping
Grattage avec du sélénium en Python
Grattage Web facile avec Scrapy
Grattage avec Tor en Python
API Web avec Python + Falcon
Web scraping avec Selenium (Python)
Scraping prévisions météorologiques avec python
Grattage avec Selenium + Python Partie 2
Application Web avec Python + Flask ② ③
J'ai essayé de gratter avec du python
Rationalisez la recherche Web avec Python
Application Web avec Python + Flask ④
Analyse de données pour améliorer POG 1 ~ Web scraping avec Python ~
Scrapage Web rapide avec Python (tout en prenant en charge le chargement JavaScript)
[Scraping] Scraping Python
Les débutants en Python sont bloqués dans leur premier scraping Web
raclage Web
Essayez de gratter avec Python + Beautiful Soup
Scraping avec Node, Ruby et Python
Scraping avec Selenium en Python (Basic)
Grattage WEB avec BeautifulSoup4 (page en couches)
Grattage avec Python, Selenium et Chromedriver
Premiers pas avec les applications Web Python
Gratter le classement Web d'Alexa avec pyQuery
Grattage avec Python et belle soupe
Surveillez les applications Web Python avec Prometheus
Obtenez une capture d'écran Web avec python
Faisons du scraping d'images avec Python
Obtenez les tendances Qiita avec le scraping Python
Web scraping pour les débutants en Python (1)