[PYTHON] BeautifulSoup-Trick: Fragen Sie nach dem Root-Tag

Dies ist eine Methode, um das Root-Tag [document] von einem beliebigen Tag von BeautifulSoup abzurufen. Es war eine Methode, die ich mir wünschte, aber aus irgendeinem Grund war sie nicht da.

bs4_root.py


from bs4 import BeautifulSoup

def root(self):
    if self.name == u'[document]':
        return self
    else:
        return [node for node in self.parents][-1]

BeautifulSoup.root = root

Die Methode find_parent (u '[document]') ist in Ordnung, dauert aber länger als der obige Code.

Recommended Posts

BeautifulSoup-Trick: Fragen Sie nach dem Root-Tag
BeautifulSoup-Trick: Entscheiden Sie das Tag, indem Sie den Pfad angeben