Ein Forscher eines Pharmaunternehmens fasste das Web-Scraping mit Python zusammen

Einführung

Hier erklären wir das Web-Scraping mit Python.

BeautifulSoup

Angenommen, Sie möchten eine Webseite crawlen und kratzen, auf der die folgende HTML-Datei angezeigt wird.

<ul class="list-group">
  <li class="list-group-item"><a href="">Element 1</a></li>
  <li class="list-group-item"><a href="">Element 2</a></li>
  <li class="list-group-item"><a href="">Element 3</a></li>
</ul>

Das Python-Skript sieht folgendermaßen aus:

import requests
from bs4 import BeautifulSoup


url =URL, um HTML zu erhalten
response = requests.get(url)
response.encoding = response.apparent_encoding

bs = BeautifulSoup(response.text, 'html.parser')

ul = bs.select('ul.list-group')

for li in ul[0].select('li.list-group-item'):
    a_tags = li.select('a')
    a_tag = a_tags[0]
    item_name = a_tag.text.strip()

Scrapy

Angenommen, Sie möchten eine HTML-Datei crawlen und kratzen, die der oben beschriebenen Datei mit Beautiful Soup ähnelt.

<ul class="list-group">
  <li class="list-group-item"><a href="">Element 1</a></li>
  <li class="list-group-item"><a href="">Element 2</a></li>
  <li class="list-group-item"><a href="">Element 3</a></li>
</ul>
import scrapy


class SampleSpider(scrapy.Spider):
    name = 'sample'
    allowd_domains = [Domain]
    start_urls = [
Ziel-URL
    ]

    def parse_list(self, response):
        ul = response.css('ul.list-group')[0]
        for li in ul.css('li.list-group-item'):
            item_url = li.css('a::attr(href)').extract_first()

            yield scrapy.Request(item_url, callback=parse_detail)

    def parse_detail(self, response):
        item_name = response.css('h1.item-name::text').extract_first()
        return item_name

Zusammenfassung

Hier erklärte ich die Methode des Web Scraping mit Beautiful Soup and Scrapy.

Referenzmaterialien / Links

Was ist die Programmiersprache Python? Kann es für KI und maschinelles Lernen verwendet werden?

Recommended Posts

Ein Forscher eines Pharmaunternehmens fasste das Web-Scraping mit Python zusammen
Ein Forscher eines Pharmaunternehmens fasste die Datenbankoperationen mit Python zusammen
Forscher von Pharmaunternehmen fassten die Aussagen zur Python-Kontrolle zusammen
Der Forscher eines Pharmaunternehmens fasste den Python-Unit-Test zusammen
Ein Forscher eines Pharmaunternehmens fasste die Klassen in Python zusammen
Ein Forscher eines Pharmaunternehmens fasste die Funktionen in Python zusammen
Ein Forscher eines Pharmaunternehmens fasste die Ausnahmebehandlung von Python zusammen
Ein Forscher eines Pharmaunternehmens fasste die Python-Codierungsstandards zusammen
Forscher von Pharmaunternehmen haben Variablen in Python zusammengefasst
Ein Forscher eines Pharmaunternehmens fasste die kanonischen Ausdrücke in Python zusammen
Ein Forscher eines Pharmaunternehmens fasste das Scannen von Dateien in Python zusammen
Ein Forscher eines Pharmaunternehmens fasste SciPy zusammen
Ein Forscher eines Pharmaunternehmens fasste RDKit zusammen
Forscher von Pharmaunternehmen fassten Scikit-Learn zusammen
Ein Forscher eines Pharmaunternehmens fasste Pandas zusammen
Web Scraping mit Selenium (Python)
Ein Forscher eines Pharmaunternehmens fasste NumPy zusammen
Ein Forscher eines Pharmaunternehmens fasste Matplotlib zusammen
Ein Forscher eines Pharmaunternehmens fasste Seaborn zusammen
Ein Forscher eines Pharmaunternehmens fasste die Einschlussnotation von Python zusammen
Ein Forscher eines Pharmaunternehmens fasste die in Python verwendeten Operatoren zusammen
Scraping mit Python
Ein Forscher eines Pharmaunternehmens fasste die Datenstruktur von Python zusammen
[Anfänger] Leicht verständliches Python-Web-Scraping mit Google Colaboratory
Ich habe versucht, Web-Scraping mit Python und Selen
So installieren Sie Python für Forscher von Pharmaunternehmen
Scraping mit Python 3.5 async / await
Web Scraping mit Python + JupyterLab
Scraping mit Python 3.5 Async-Syntax
Web Scraping mit AWS Lambda
Web Scraping Anfänger mit Python
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Web Scraping für Anfänger in Python (1)
Web Scraping für Anfänger in Python (4) -1
Ein Forscher eines Pharmaunternehmens fasste die grundlegenden Beschreibungsregeln von Python zusammen
WEB-Scraping mit Python (für persönliche Notizen)
Erste Schritte mit Python Web Scraping Practice
[Persönlicher Hinweis] Scraping von Webseiten in Python3
[Scraping] Python-Scraping
Pferderennseite Web Scraping mit Python
Scraping von Websites mit JavaScript in Python
Erste Schritte mit Python Web Scraping Practice
[Python] Eine Tabelle mit Beautiful Soup kratzen
Üben des Web-Scrapings mit Python und Selen
Einfaches Web-Scraping mit Python und Ruby
Web Scraping
[Für Anfänger] Versuchen Sie Web Scraping mit Python
Führen Sie das WEB-Scraping regelmäßig mit AWS-Lambda + Python + Cron aus
Vorgehensweise zur Verwendung der WEG-API von TeamGant (mit Python)
Versuchen Sie es mit dem Python-Webframework Tornado Part 1
Erstellen Sie eine Webmap mit Python und GDAL
[Python] Fluss vom Web-Scraping zur Datenanalyse
Versuchen Sie es mit dem Python-Webframework Tornado Part 2
Web Scraping mit Python (Wettervorhersage)
Web Scraping mit Python (Aktienkurs)
Python-Scraping-Memo