Grundlegende Zusammenfassung des Scrapings mit Anfragen, die Anfänger absolut verstehen können [Python]

Fordert Grundlagen an

import

import requests

Sie werden diesen Import definitiv brauchen.

Holen Sie sich die Quelle von der Website

Sie sollten sich an diese beiden erinnern.

Holen Sie sich mit GET-Methode (request.get)

import requests

url = 'https://www.yahoo.co.jp/'
response = requests.get(url)
print(response) # →<Response [200]>

html = response.text
print(html) #→ HTML-Quellzeichenfolge

Der Rückgabewert von request.get (url) ist der HTTP-Statuscode. Bei Erfolg werden 200 zurückgegeben.

Sie können die gesuchte HTML-Quellzeichenfolge in response.text abrufen.

Mit POST-Methode abrufen (request.post)

Ohne die POST-Methode erhalten Sie möglicherweise nicht die gesuchte Quelle.

data =  {'username':'tarouyamada', 'password':'4r8q99fiad'}

response = requests.post(url, data=data)

Jetzt können Sie die Anfrage einschließlich des Anfragekörpers senden.

So fügen Sie einen Anforderungsheader hinzu

headers = {'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36', 
'accept': 'application/json'}

response = requests.get(url, headers=headers)

Sie können die Anfrage jetzt mit dem angehängten Anforderungsheader senden. Die Schreibmethode ist für get und post üblich.

Holen Sie sich ein Bild

Sie können Binärdaten mit .content abrufen. Bilder sind auch eine Art Binärdaten.

response = requests.get(url)

img_data = response.content

print(img_data)
#b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x00\x00\x01\x00\x01\x00\x00\xff\xdb\x00C\x00\x03\x02\x02\x03\x02\x02\x03\x03\x03\x03\x04\x03\x03\x04\x05\x08\x05\x05\x04\x04\x05\n\x07\x07\x06\x08\x0c\n\x0………

print(type(img_data))
# <class 'bytes'>

Bild speichern
with open('test.jpg', 'wb') as f:
    f.write(response.content)

Parameterspezifikation

params = {'q':'qiita', 'date':'2020-7-3'}

response = requests.get(url, params=params)

Antwortheader anzeigen

response = requests.get(
    'https://www.pakutaso.com/shared/img/thumb/nekocyan458A3541_TP_V.jpg')

print(response.headers)

# {'Server': 'nginx', 'Date': 'Tue, 07 Jul 2020 22:39:37 GMT', 'Content-Type': 'image/jpeg', 'Content-Length': '239027', 'Last-Modified': 'Sun, 05 Jul 2020 01:51:48 GMT', 'Connection': 'keep-alive', 'ETag': '"5f013234-3a5b3"', 'Expires': 'Thu, 06 Aug 2020 22:39:37 GMT', 'Cache-Control': 'max-age=2592000', 'X-Powered-By': 'PleskLin', 'Strict-Transport-Security': 'max-age=31536000;  includeSubDomains; preload', 'Accept-Ranges': 'bytes'}

Wenn es eine Weiterleitung gibt

Erhalten Sie die Antwort des Umleitungsziels

Wenn Sie den Verlauf während der Umleitung verwenden möchten, verwenden Sie .history

Überprüfen Sie die Codierung

response = requests.get(
    'https://qiita.com/')

print(response.encoding)

# utf-8

Holen Sie sich JSON-Daten

--Kann als Wörterbuch mit response.json () erhalten werden

response = requests.get(url)

json_dict = response.json()

Recommended Posts

Grundlegende Zusammenfassung des Scrapings mit Anfragen, die Anfänger absolut verstehen können [Python]
[Python] Einführung in das WEB-Scraping | Zusammenfassung der Methoden, die mit dem Webdriver verwendet werden können
Zusammenfassung des grundlegenden Ablaufs des maschinellen Lernens mit Python
Formatübersicht der Formate, die mit gensim serialisiert werden können
[Für Anfänger] Zusammenfassung der Standardeingabe in Python (mit Erklärung)
Grundlegende Zusammenfassung der Datenoperationen mit Python Pandas - Erste Hälfte: Datenerstellung und -operationen
Scraping mit Selen in Python (Basic)
Grundlegendes Studium von OpenCV mit Python
[Django] Eine einfache Zusammenfassung der Protokollausgabefunktion, damit auch Anfänger sie verstehen können.
[Für Anfänger] Versuchen Sie Web Scraping mit Python
Lösen Sie mit Python [100 frühere Fragen, die Anfänger und Fortgeschrittene lösen sollten] (034-038 Dynamische Planungsmethode: Knapsack DP basic)
Python-Übungsdatenanalyse Zusammenfassung des Lernens, dass ich ungefähr 10 mit 100 Schlägen getroffen habe
Scraping mit Python
Scraping mit Python
[Python] Zusammenfassung der S3-Dateivorgänge mit boto3
Ein Liner, der mit Python ein Umfangsverhältnis von 10000 Stellen ausgibt
Grundlegende Geschichte der Vererbung in Python (für Anfänger)
Zusammenfassung der statistischen Datenanalysemethoden mit Python, die im Geschäftsleben verwendet werden können
[Einführung in Python] Grundlegende Verwendung der Bibliothek scipy, die Sie unbedingt kennen müssen
Web Scraping für Anfänger in Python (1) Verbesserte Version
Zusammenfassung der Tools zum Betreiben der Windows-Benutzeroberfläche mit Python
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
Hinweise zu Python-Kenntnissen, die mit AtCoder verwendet werden können
Python-Anfänger bleiben beim ersten Web-Scraping stecken
Versuchen Sie es mit Python.
Grundlagen der Python-Scraping-Grundlagen
Scraping mit Python + PhantomJS
Grundkenntnisse in Python
Zusammenfassung der Python-Argumente
Schaben mit Selen [Python]
Wiederholen Sie den Vorgang mit Python-Anforderungen
Scraping mit Python + PyQuery
Scraping von RSS mit Python
Grundlegende Zusammenfassung der Datenoperationen in Python Pandas - Zweite Hälfte: Datenaggregation
Ich habe die grundlegende Grammatik von Python in Jupyter Lab geschrieben
Einführung in Python, die auch Affen verstehen können (Teil 3)
Die Zusammenfassung des maschinellen Lernens in Python für Anfänger ist sehr kurz.
Einführung in Python, die auch Affen verstehen können (Teil 1)
Einführung in Python, die auch Affen verstehen können (Teil 2)
Zusammenfassung der Module, die die Installation von WebDriver mit Python automatisieren und unterstützen
Hier finden Sie eine Zusammenfassung der Dinge, die beim Umgang mit komplexen Zahlen in Python hilfreich sein können
Verstehen Sie die Wahrscheinlichkeiten und Statistiken, die für das Fortschrittsmanagement mit einem Python-Programm verwendet werden können
[Python] Ein Programm, das die maximale Anzahl von Spielzeugen findet, die mit Ihrem Geld gekauft werden können
Ich habe versucht, mit Python zu kratzen
Web Scraping mit Python + JupyterLab
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Zusammenfassung der Python3-Listenoperationen
Schaben mit Chromedriver in Python
BASIC-Authentifizierung mit Python-Flasche
Festliches Scraping mit Python, Scrapy
[Python] Verwenden von OpenCV mit Python (Basic)
Scraping mit Selen in Python
Scraping mit Tor in Python
Kratzwettervorhersage mit Python
Grundlegende Python-Grammatik für Anfänger
Zusammenfassung der grundlegenden Verwendung von Pandas
Schaben mit Selen + Python Teil 2