Dies ist eine Methode, um das Root-Tag [document] von einem beliebigen Tag von BeautifulSoup abzurufen. Es war eine Methode, die ich mir wünschte, aber aus irgendeinem Grund war sie nicht da.
bs4_root.py
from bs4 import BeautifulSoup
def root(self):
if self.name == u'[document]':
return self
else:
return [node for node in self.parents][-1]
BeautifulSoup.root = root
Die Methode find_parent (u '[document]')
ist in Ordnung, dauert aber länger als der obige Code.