[PYTHON] Astuce BeautifulSoup: demandez la balise racine

C'est une méthode pour obtenir la balise racine [document] à partir de n'importe quelle balise de BeautifulSoup. C'était une méthode que j'aurais aimé avoir, mais pour une raison quelconque, elle n'était pas là.

bs4_root.py


from bs4 import BeautifulSoup

def root(self):
    if self.name == u'[document]':
        return self
    else:
        return [node for node in self.parents][-1]

BeautifulSoup.root = root

La méthode find_parent (u '[document]') convient, mais elle prend plus de temps que le code ci-dessus.

Recommended Posts

Astuce BeautifulSoup: demandez la balise racine
Astuce BeautifulSoup: choisissez la balise en spécifiant le chemin
Balise xmp [Python] pour les photos