C'est une méthode pour obtenir la balise racine [document] à partir de n'importe quelle balise de BeautifulSoup. C'était une méthode que j'aurais aimé avoir, mais pour une raison quelconque, elle n'était pas là.
bs4_root.py
from bs4 import BeautifulSoup
def root(self):
if self.name == u'[document]':
return self
else:
return [node for node in self.parents][-1]
BeautifulSoup.root = root
La méthode find_parent (u '[document]')
convient, mais elle prend plus de temps que le code ci-dessus.