[PYTHON] Wie fange ich mit Scrapy an?

Offizielles Dokument:

https://doc-ja-scrapy.readthedocs.io/ja/latest/index.html

Bis das Crawlen ausgeführt wird

#Projekterstellung
$ scrapy startproject <project name>

#Aufbau
$ cat setting.py
    DOWNLOAD_DELAY = 1
    FEED_EXPORT_ENCODING = "utf-8"

#Spinne erstellen
$ scrapy genspider <mydomain> <mydomain.com>

#Schreiben Sie eine Analyseverarbeitung und führen Sie das Crawlen aus
$ scrappy crawl <spider name>

Beispiel analysieren

def parse(self, response):
        for sel in response.css('#gmap_list > li > a'):
            next_page = response.urljoin(sel.css('a::attr("href")').get())
            yield scrapy.Request(next_page, callback=self.parse_detail)

def parse_detail(self, response):
    '''
Detaillierte Seitenanalyse
    '''

ORM Wenn Sie es verwenden, scheint Orator einfach und leicht zu bedienen zu sein. https://orator-orm.com/docs/0.9/basic_usage.html

Recommended Posts

Wie fange ich mit Scrapy an?
Erste Schritte mit Python
Wie fange ich mit Django an?
Link, um mit Python zu beginnen
So erhalten Sie die Eltern-ID mit sqlalchemy
Wie Python-Anfänger mit Progete beginnen
Beginnen Sie mit MicroPython
Beginnen Sie mit Mezzanine
Ich habe versucht, das Entwicklungsstartverfahren von Django kurz zusammenzufassen
Der einfachste Weg, um mit Django zu beginnen
Zubu Amateur will Python starten
Fangen Sie mit Django an! ~ Tutorial ⑤ ~
Beginnen Sie mit influxDB + Grafana
Wie aktualisiere ich mit SQLAlchemy?
Wie man mit Theano besetzt
Fangen Sie mit Django an! ~ Tutorial ⑥ ~
Wie mit SQLAlchemy ändern?
So trennen Sie Zeichenfolgen mit ','
Beginnen Sie mit Python! ~ ② Grammatik ~
Wie man RDP auf Fedora31 macht
Wie lösche ich mit SQLAlchemy?
Ich habe versucht, mit Blenders Python script_Part 01 zu beginnen
Ich habe versucht, mit Blenders Python script_Part 02 zu beginnen
So erhalten Sie mit SQLAlchemy + MySQLdb mehr als 1000 Daten
Wie man mit Python-Flüchen ein Urteil über das Mausrad erhält
So starten Sie das Python-Projekt im Jahr 2020 (Windows WSL und Mac Common)
So brechen Sie RT mit tweepy ab
Python: So verwenden Sie Async mit
Beginnen Sie mit Python! ~ ① Umweltbau ~
Mindestkenntnisse, um mit dem Python-Protokollierungsmodul zu beginnen
Erste Schritte mit MicroPython (unter macOS)
So verwenden Sie virtualenv mit PowerShell
So installieren Sie Python-Pip mit Ubuntu20.04LTS
Umgang mit unausgeglichenen Daten
Erste Schritte mit Visual Studio Online ~ Das Ende der Ära der Umgebungskonstruktion ~
Ich habe versucht, mit Hy ・ Define a class zu beginnen
Umgang mit dem DistributionNotFound-Fehler
Aufblasen von Daten (Datenerweiterung) mit PyTorch
So gelangen Sie mit Vagrant in die Python-Entwicklungsumgebung
So berechnen Sie das Datum mit Python
So installieren Sie den MySQL-Connector mit pip3
Beginnen Sie mit dem maschinellen Lernen mit SageMaker
So verbinden Sie INNER mit SQL Alchemy
Beginnen Sie mit Python mit Blender
So installieren Sie Anaconda mit pyenv
[Einführung in Python] So erhalten Sie Daten mit der Funktion listdir
Führen Sie das Programm aus, ohne eine Python-Umgebung zu erstellen! !! (Erste Schritte mit Google Colaboratory)
So erhalten Sie die ID von Type2Tag NXP NTAG213 mit nfcpy
[Python] Ein Memo, das ich versucht habe, mit Asyncio zu beginnen
Ich habe ein Skript geschrieben, mit dem Sie mit hoher Geschwindigkeit mit AtCoder beginnen können!
So erhalten Sie das Verzeichnis, in dem die mit Pyinstaller erstellte EXE-Datei vorhanden ist
Erste Schritte zur Lösung linearer Planungsprobleme mit PuLP
So erhalten Sie den gesamten Datenverkehr über VPN mit OpenVPN unter Linux
Ich habe am Wochenende versucht, mit Bitcoin Systre zu beginnen
[Python] So erhalten Sie mit Enum einen Wert mit einem anderen Schlüssel als dem Wert