Ein Freund, der einen Manga auf einer raubkopierten Manga-Site namens manga1001.com liest "Es gibt viele radikale Anzeigen, die ich draußen nicht sehen kann, und wenn ich Adblock verwende, erhalte ich eine Warnung." Ich sagte, also lass es uns löschen! Ich dachte.
Wenn Sie etwas Ähnliches wie diesen Artikel tun,
Bitte seien Sie vorsichtig. Sie können schuldig sein.
src
von img
Ich verwende Chrome Canary, damit es in Ordnung ist, wenn es kaputt geht.
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import chromedriver_binary
from time import sleep
#Pfad zur Ausgabe der generierten HTML-Datei
output_path = '/Users/hoge/fuga/'
#Webdriver-Optionen
options = Options()
#Geben Sie den Pfad von Google Chrome Canary an
options.binary_location = '/Applications/Google Chrome Canary.app/Contents/MacOS/Google Chrome Canary'
#Geben Sie die Größe des Fensters an
options.add_argument('window-size=1600,900')
#Fragen Sie nach der URL der Seite, auf der Sie die Anzeige entfernen möchten
url = input('enter url: ')
#Starten Sie Chrome
driver = webdriver.Chrome(options=options)
driver.get(url)
#Warten Sie einen Moment, bis die Seite JavaScript ausgeführt hat
sleep(3)
#Titel holen
title = driver.find_elements_by_class_name('entry-title')[0].text
#Holen Sie sich WebElement des img-Elements als Array
contents = driver.find_elements_by_css_selector('.entry-content figure img')
#Weisen Sie der Ausgabe der Ausgabevariablen eine Zeichenfolge zu, die als HTML angezeigt werden soll
output = '''
<!DOCTYPE html>
<html>
<head>
<style>
body{
background-color:#333;
}
img{
display: block;
margin: 10px auto;
width: 100%;
max-width: 600px;
box-shadow: 0 0 10px black;
}
</style>
</head>
<body>
'''
#Fügen Sie das src-Attribut des erfassten img-Elements hinzu, um es als Bild auszugeben
for content in contents:
output += '<img src="{}"/>'.format(content.get_attribute('src'))
#Fügen Sie der Ausgabe ein schließendes Tag hinzu
output += '</body></html>'
#Erstellen Sie eine HTML-Datei mit dem Titelnamen und schreiben Sie die Ausgabe
with open('{0}{1}.html'.format(output_path, title), 'w', encoding='utf-8') as f:
f.write(output)
#Öffnen Sie die erstellte HTML-Datei
driver.get('file://{0}{1}.html'.format(output_path, title))
Ich konnte den Inhalt der überfüllten Site durch Schaben ordentlich organisieren. Auch hier werde ich es nicht selbst verwenden und ich habe dieses Programm keinem Freund gegeben. Ich wollte nur kratzen! Lol