[PYTHON] Verwenden Sie BeautifulSoup, um einen Link mit einer Zeichenfolge aus einer HTML-Datei zu extrahieren

-Extrahieren Sie Links mit "mp4" aus HTML-Dateien. -Verwendet schöne Suppe.


from BeautifulSoup import BeautifulSoup

open_name = raw_input('Open html file: ')
save_name = raw_input('Save file name: ')

f = open(open_name)
html = f.read()
f.close()

f2 = open(save_name, 'w')

soup = BeautifulSoup(html)

for link in soup.findAll("a"):
    if "mp4" in link.get("href"): # "mp4"Extrahieren Sie Links mit
        f2.writelines(link.get('href') + '¥n')

f2.close()

Ich habe auf den unten verlinkten Stapelüberlauf verwiesen. Bitte weisen Sie darauf hin, ob es einen anderen guten Weg gibt.

Referenz: python - how can I get href links from html code - Stack Overflow https://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code/3075568#3075568

Recommended Posts

Verwenden Sie BeautifulSoup, um einen Link mit einer Zeichenfolge aus einer HTML-Datei zu extrahieren
Versuchen Sie, mit Python3 eine Zeichenfolge aus einem Bild zu extrahieren
Verwendung der NUITKA-Utilities-Hinweis-Kompilierung zum einfachen Erstellen einer ausführbaren Datei aus einem Python-Skript
Konvertieren Sie eine Zeichenfolge in ein Bild
Geben Sie die Zeile mit der angegebenen Zeichenfolge aus der Textdatei aus
So extrahieren Sie die gewünschte Zeichenfolge aus einem Befehl in Zeile 4
Ich möchte mit Python eine beliebige URL aus der Zeichenfolge der HTML-Quelle extrahieren
[Memo] Verwendung von BeautifulSoup4 (1) HTML anzeigen
# 5 [python3] Extrahiert Zeichen aus einer Zeichenfolge
So erstellen Sie ein Funktionsobjekt aus einer Zeichenfolge
[Python] Kombinieren von Listen mit Zahlen zu Zeichenfolgen und Schreiben in eine Ausgabedatei
So extrahieren Sie den Koeffizienten aus der Minutenformel
Ich habe versucht, die Strichzeichnung mit Deep Learning aus dem Bild zu extrahieren
Extrahieren Sie mit Pandas Zeilen, die eine bestimmte "Zeichenfolge" enthalten
Ich habe ein Paket erstellt, um eine ausführbare Datei aus dem Hy-Quellcode zu erstellen
Konvertieren Sie eine Pfadzeichenfolge, die einen symbolischen Link in der Mitte verwendet, in einen absoluten Pfad
Analysieren Sie eine JSON-Zeichenfolge, die in eine Datei in Python geschrieben wurde
Schritte von der Installation von Django bis zur Anzeige der HTML-Seite
Backtrader So importieren Sie einen Indikator aus einer anderen Datei
So verwandeln Sie eine .py-Datei in eine .exe-Datei
Python-Skript, das eine JSON-Datei aus einer CSV-Datei erstellt
Einführung in das maschinelle Lernen mit Simple Perceptron
Verwenden Sie Boto3, um über 1000 Präfixe aus der Dateiliste von S3 abzurufen
So generieren Sie einen öffentlichen Schlüssel aus einem privaten SSH-Schlüssel
Probleme mit verstümmelten Zeichen beim Drucken eines Arrays mit einer Zeichenfolge, die utf-8 enthält
Python> Aus einer mehrzeiligen Zeichenfolge anstelle einer Datei lesen> io.StringIO ()
So verwenden Sie eine andere Datei als .fabricrc als Konfigurationsdatei
[Python] So geben Sie eine Pandas-Tabelle in eine Excel-Datei aus
Extrahieren Sie den Wert, der einem Wert am nächsten kommt, aus einem Listenelement in Python
Konvertieren Sie HTML in eine Textdatei
[Python] Verwenden Sie eine Zeichenfolgenfolge
Laden Sie eine Datei in Dropbox hoch
So fügen Sie eine CSV-Datei mit Pandas in eine Excel-Datei ein
Erstellen Sie eine Instanz einer vordefinierten Klasse aus einer Zeichenfolge in Python
So machen Sie einen String in Python zu einem Array oder ein Array zu einem String
So erhalten Sie eine Zeichenfolge aus einem Befehlszeilenargument in Python
Verwendung der visuellen Erkennung, um die LINE ID von einem Mädchen zu erhalten
Ich habe ein Skript geschrieben, um Webseiten-Links in Python zu extrahieren
So erstellen Sie mit Faker eine CSV-Dummy-Datei mit Japanisch
So bekommen Sie einen Ingenieur aus Ihren 30ern
Finden Sie alle Muster, um eine bestimmte Zahl aus dem Satz zu extrahieren