[PYTHON] Le volume de html extrait par PyQuery est perturbé par xml

J'ai essayé d'utiliser PyQuery, mais quand j'extrais tout le html interne de la classe item_detail avec PyQuery,

d = PyQuery(htmlstr)
detail = d('.item_detail').html()

Je l'ai fait, mais quand j'ai affiché le résultat de l'acquisition dans Chrome, c'était assez étrange, la raison en était qu'il y avait un iframe à l'intérieur, mais à l'origine c'était <iframe src = XXX> </ iframe>, mais PyQuery Si vous l'extrayez avec, il ressemble à <iframe src = XXX />, et il devient XML. Apparemment, à cause de ce type, l'affichage suivant est étrange. Si vous regardez attentivement, vous pouvez dire "
" ou "
" et tous sont en XML! !! Je veux juste extraire une partie, mais je me demande si vous pouvez le faire sans permission! !! !! Vous sentez-vous comme Fujiyoshiro! !! !! !!

Donc, je voulais que ce soit juste du HTML, mais quand j'ai regardé le document officiel, c'était comme ça.

d = PyQuery(htmlstr)
detail = d('.item_detail').html(method='html')

C'est tout. J'étais un peu perdu, alors j'ai fait un mémorandum. C'est tout.

Recommended Posts

Le volume de html extrait par PyQuery est perturbé par xml
Pour se connecter au WIFI, qui est limité par l'adresse MAC avec CentOS (Network Manager).