[PYTHON] So erhalten Sie eine Liste mit Links von einer Seite aus Wikipedia

[Web-Scraping mit Python](https://www.amazon.co.jp/Python%E3%81%AB%E3%82%88%E3%82%8BWeb%E3%82%B9%E3%82%AF % E3% 83% AC% E3% 82% A4% E3% 83% 94% E3% 83% B3% E3% 82% B0-Ryan-Mitchell / dp / 4873117615). Holen Sie sich darin den im Artikel enthaltenen Link von der Wikipedia-Seite. Das Beispiel in diesem Buch scheint eine englische Seite zu sein, daher habe ich es für die japanische Wikipedia ein wenig verbessert.

Ausführungsumgebung

OS：OX X EI Capitan(10.11.5) Python:3.5.1

#codeing:utf-8

import re
from bs4 import BeautifulSoup
from urllib.request import urlopen
from urllib.parse import unquote

url = "https://ja.wikipedia.org/wiki/%E3%83%86%E3%82%A4%E3%83%AB%E3%82%BA_%E3%82%AA%E3%83%96_%E3%82%A4%E3%83%8E%E3%82%BB%E3%83%B3%E3%82%B9"

html = urlopen(url)
bsObj = BeautifulSoup(html,'html.parser')

pattern = re.compile("^(/wiki/)((?!:).)*$")

for link in bsObj.find('div',{'id':'bodyContent'}).findAll('a',href = pattern):
    if 'href' in link.attrs:
        print (unquote(link.attrs['href']))

Recommended Posts

So erhalten Sie eine Liste mit Links von einer Seite aus Wikipedia

So erhalten Sie eine Liste der integrierten Ausnahmen für Python

So schreiben Sie einen Listen- / Wörterbuchtyp von Python3

So erhalten Sie mit Python eine Liste der Dateien im selben Verzeichnis

[Python] So erstellen Sie eine Liste von Zeichenfolgen Zeichen für Zeichen

So mischen Sie einen Teil der Python-Liste (at random.shuffle)

[Befehl] Befehl zum Abrufen einer Liste von Dateien mit Zeichen voller Breite

Extrahieren Sie Seiten aus Wikipedia-Dumps

So erhalten Sie den letzten (letzten) Wert in einer Liste in Python

So greifen Sie über Python auf Wikipedia zu

So verbinden Sie den Inhalt der Liste mit einer Zeichenfolge

[Python] So erstellen Sie eine Tabelle aus einer Liste (grundlegende Operation zum Erstellen von Tabellen / Ändern des Matrixnamens)

Versuchen Sie, die Thread-Liste der Nachrichten (Abneigung) mit Python zu erhalten.

So erhalten Sie eine Zeichenfolge aus einem Befehlszeilenargument in Python

[Python] So erhalten und ändern Sie Zeilen / Spalten / Werte aus einer Tabelle.

Ich habe versucht, das Entwicklungsstartverfahren von Django kurz zusammenzufassen

Verwendung der visuellen Erkennung, um die LINE ID von einem Mädchen zu erhalten

Ich habe versucht, mit Boto3 eine Liste der AMI-Namen zu erhalten

So ermitteln Sie die Scheitelpunktkoordinaten eines Features in ArcPy

Wie erhalte ich eine Liste ohne Elemente, deren Index i ... ist?

So bekommen Sie einen Ingenieur aus Ihren 30ern

So entfernen Sie Duplikate aus einer Python-Liste unter Beibehaltung der Reihenfolge.

So erstellen Sie einen Klon aus Github

Wie man lange Einschlüsse loswird

[Python] So konvertieren Sie eine zweidimensionale Liste in eine eindimensionale Liste

Wie bekomme ich Stacktrace in Python?

[Python] Ruft eine Liste der Instanzvariablen ab

So erstellen Sie ein Repository aus Medien

Zusammenfassung der Verwendung der Python-Liste

So testen Sie auf einer von Django authentifizierten Seite

[Python] Nur eine Liste der Ordner abrufen

[Einführung in Python] So sortieren Sie den Inhalt einer Liste effizient mit Listensortierung

[Linux] Ein Befehl zum Abrufen einer Liste der in der Vergangenheit ausgeführten Befehle

So erhalten Sie den Wert aus dem Parameterspeicher in Lambda (mit Python)

So finden Sie den Ansichtsnamen mit dem Namespace über die URL (path_info) in Django

So erhalten Sie mithilfe der API von Virus Total einen Beispielbericht aus einem Hashwert

So formatieren Sie eine Liste von Wörterbüchern (oder Instanzen) in Python

So berechnen Sie die Volatilität einer Marke

So öffnen Sie einen Webbrowser über Python

So löschen Sie einen Taple in einer Liste (Python)

So erstellen Sie ein Funktionsobjekt aus einer Zeichenfolge

So erhalten Sie Ergebnisse von id in Celery

So generieren Sie ein Python-Objekt aus JSON

Holen Sie sich eine Liste der IAM-Benutzer mit Boto3

So erhalten Sie Elemente vom Typ Wörterbuch von Python 2.7

Holen Sie sich Qiitas "Gefällt mir" -Liste durch Schaben

So übergeben Sie das Ergebnis der Ausführung eines Shell-Befehls in einer Liste in Python

Wie kann man in Go so etwas wie eine Liste von void * (oder Variantentypen) erreichen?

[NNabla] So erhalten Sie die Ausgabe (Variable) der mittleren Schicht des erstellten Netzwerks

Python-Skript zum Abrufen einer Liste von Eingabebeispielen für den AtCoder-Wettbewerb

[Einführung in Python] So erhalten Sie den Datenindex mit der for-Anweisung

Verwendung der Liste []

[Python] So entfernen Sie doppelte Werte aus der Liste

So ermitteln Sie die Anzahl der Stellen in Python

Konvertieren Sie das Slice-Objekt in eine Liste mit Indexnummern

Hinweise zur Verwendung von AIST Spacon ABCI

So erhalten Sie einen angemeldeten Benutzer mit Djangos forms.py

Python: Ruft eine Liste der Methoden für ein Objekt ab

Grundlagen von PyTorch (2) - Wie erstelle ich ein neuronales Netzwerk?