[PYTHON] So erhalten Sie eine Liste mit Links von einer Seite aus Wikipedia

[Web-Scraping mit Python](https://www.amazon.co.jp/Python%E3%81%AB%E3%82%88%E3%82%8BWeb%E3%82%B9%E3%82%AF % E3% 83% AC% E3% 82% A4% E3% 83% 94% E3% 83% B3% E3% 82% B0-Ryan-Mitchell / dp / 4873117615). Holen Sie sich darin den im Artikel enthaltenen Link von der Wikipedia-Seite. Das Beispiel in diesem Buch scheint eine englische Seite zu sein, daher habe ich es für die japanische Wikipedia ein wenig verbessert.

Ausführungsumgebung

OS:OX X EI Capitan(10.11.5) Python:3.5.1

#codeing:utf-8

import re
from bs4 import BeautifulSoup
from urllib.request import urlopen
from urllib.parse import unquote

url = "https://ja.wikipedia.org/wiki/%E3%83%86%E3%82%A4%E3%83%AB%E3%82%BA_%E3%82%AA%E3%83%96_%E3%82%A4%E3%83%8E%E3%82%BB%E3%83%B3%E3%82%B9"

html = urlopen(url)
bsObj = BeautifulSoup(html,'html.parser')

pattern = re.compile("^(/wiki/)((?!:).)*$")

for link in bsObj.find('div',{'id':'bodyContent'}).findAll('a',href = pattern):
    if 'href' in link.attrs:
        print (unquote(link.attrs['href']))     

Recommended Posts

So erhalten Sie eine Liste mit Links von einer Seite aus Wikipedia
So erhalten Sie eine Liste der integrierten Ausnahmen für Python
So schreiben Sie einen Listen- / Wörterbuchtyp von Python3
So erhalten Sie mit Python eine Liste der Dateien im selben Verzeichnis
[Python] So erstellen Sie eine Liste von Zeichenfolgen Zeichen für Zeichen
So mischen Sie einen Teil der Python-Liste (at random.shuffle)
[Befehl] Befehl zum Abrufen einer Liste von Dateien mit Zeichen voller Breite
Extrahieren Sie Seiten aus Wikipedia-Dumps
So erhalten Sie den letzten (letzten) Wert in einer Liste in Python
So greifen Sie über Python auf Wikipedia zu
So verbinden Sie den Inhalt der Liste mit einer Zeichenfolge
[Python] So erstellen Sie eine Tabelle aus einer Liste (grundlegende Operation zum Erstellen von Tabellen / Ändern des Matrixnamens)
Versuchen Sie, die Thread-Liste der Nachrichten (Abneigung) mit Python zu erhalten.
So erhalten Sie eine Zeichenfolge aus einem Befehlszeilenargument in Python
[Python] So erhalten und ändern Sie Zeilen / Spalten / Werte aus einer Tabelle.
Ich habe versucht, das Entwicklungsstartverfahren von Django kurz zusammenzufassen
Verwendung der visuellen Erkennung, um die LINE ID von einem Mädchen zu erhalten
Ich habe versucht, mit Boto3 eine Liste der AMI-Namen zu erhalten
So ermitteln Sie die Scheitelpunktkoordinaten eines Features in ArcPy
Wie erhalte ich eine Liste ohne Elemente, deren Index i ... ist?
So bekommen Sie einen Ingenieur aus Ihren 30ern
So entfernen Sie Duplikate aus einer Python-Liste unter Beibehaltung der Reihenfolge.
So erstellen Sie einen Klon aus Github
Wie man lange Einschlüsse loswird
[Python] So konvertieren Sie eine zweidimensionale Liste in eine eindimensionale Liste
Wie bekomme ich Stacktrace in Python?
[Python] Ruft eine Liste der Instanzvariablen ab
So erstellen Sie ein Repository aus Medien
Zusammenfassung der Verwendung der Python-Liste
So testen Sie auf einer von Django authentifizierten Seite
[Python] Nur eine Liste der Ordner abrufen
[Einführung in Python] So sortieren Sie den Inhalt einer Liste effizient mit Listensortierung
[Linux] Ein Befehl zum Abrufen einer Liste der in der Vergangenheit ausgeführten Befehle
So erhalten Sie den Wert aus dem Parameterspeicher in Lambda (mit Python)
So finden Sie den Ansichtsnamen mit dem Namespace über die URL (path_info) in Django
So erhalten Sie mithilfe der API von Virus Total einen Beispielbericht aus einem Hashwert
So formatieren Sie eine Liste von Wörterbüchern (oder Instanzen) in Python
So berechnen Sie die Volatilität einer Marke
So öffnen Sie einen Webbrowser über Python
So löschen Sie einen Taple in einer Liste (Python)
So erstellen Sie ein Funktionsobjekt aus einer Zeichenfolge
So erhalten Sie Ergebnisse von id in Celery
So generieren Sie ein Python-Objekt aus JSON
Holen Sie sich eine Liste der IAM-Benutzer mit Boto3
So erhalten Sie Elemente vom Typ Wörterbuch von Python 2.7
Holen Sie sich Qiitas "Gefällt mir" -Liste durch Schaben
So übergeben Sie das Ergebnis der Ausführung eines Shell-Befehls in einer Liste in Python
Wie kann man in Go so etwas wie eine Liste von void * (oder Variantentypen) erreichen?
[NNabla] So erhalten Sie die Ausgabe (Variable) der mittleren Schicht des erstellten Netzwerks
Python-Skript zum Abrufen einer Liste von Eingabebeispielen für den AtCoder-Wettbewerb
[Einführung in Python] So erhalten Sie den Datenindex mit der for-Anweisung
Verwendung der Liste []
[Python] So entfernen Sie doppelte Werte aus der Liste
So ermitteln Sie die Anzahl der Stellen in Python
Konvertieren Sie das Slice-Objekt in eine Liste mit Indexnummern
Hinweise zur Verwendung von AIST Spacon ABCI
So erhalten Sie einen angemeldeten Benutzer mit Djangos forms.py
Python: Ruft eine Liste der Methoden für ein Objekt ab
Grundlagen von PyTorch (2) - Wie erstelle ich ein neuronales Netzwerk?