Erstellt eine Seite, die endlos HTML ausgibt und das Laden nicht beendet.
Ich wollte eine ähnliche Seite kratzen, also für diesen Test. Ich habe die Scraping-Methode in [diesem Artikel] geschrieben (https://qiita.com/bunnyhopper_isolated/items/f949b2bb3b57d6a7c6f1).
Die Implementierung einer unendlichen Bildlaufseite erfolgt häufig mit Javascript, und die Quelle ist endlich (endet), sodass Sie die Quelle mit curl oder request.get abrufen können. Andererseits beendet die diesmal eingeführte Konfiguration das Laden der Quelle nicht, sodass das übliche Curl und request.get eine Zeitüberschreitung aufweist.
inf_page.py
import sys
import http.server
from http.server import SimpleHTTPRequestHandler
from http.server import BaseHTTPRequestHandler
from time import sleep
class infiniteHandler(BaseHTTPRequestHandler):
def do_GET(self):
self.send_response(200)
self.send_header('Content-type', 'text/html')
self.send_header('Transfer-Encodeing', 'chunked')
self.end_headers()
inc = 0
while(True):
try:
self.wfile.write(f"<p>Hello World ! {inc}</p>".encode("ascii"))
self.wfile.flush()
print("wrote")
sleep(2)
inc += 1
except:
break
return
server_address = ('127.0.0.1', 8000)
infiniteHandler.protocol_version = "HTTP/1.1"
httpd = http.server.HTTPServer(server_address, infiniteHandler)
sa = httpd.socket.getsockname()
print("Serving HTTP on", sa[0], "port", sa[1], "...")
httpd.serve_forever()
Durchsuchen Sie [http: // localhost: 8000](http: // localhost: 8000) mit Ihrem Browser.
das ist alles. Ich habe die Scraping-Methode in [diesem Artikel] geschrieben (https://qiita.com/bunnyhopper_isolated/items/f949b2bb3b57d6a7c6f1).