Ich bin ein Scraping-Anfänger, der gerade mit Python angefangen hat. Notieren Sie sich diesmal, wie Sie nur die Zahlen aus den durch Scraping extrahierten Daten extrahieren.
Extrahieren Sie nur Zahlen aus den durch Scraping extrahierten Daten
Extrahieren Sie nur Zahlen mit ** regulären Ausdrücken **
Verwenden Sie das Re-Modul. Führen Sie den folgenden Befehl vom Terminal aus, um Regex zu installieren.
$ pip install regex
Als nächstes importieren wir das ** re-Modul ** in sample.py.
sample.py
import re
Jetzt können Sie das Modul re verwenden.
sample.py
import re
dt = "regnkrnfskrngkaer gksgnkq laergnnktga3r erfkl 400 registrants aelrkna erglknnarg"
num = re.sub("\\D", "", dt)
print(num)
# 400
sample.py
import re
dt = ['regnkrnfskrngkaer', 'gksgnkq', 'laergnnktgar', 'erfkl', '400 Registranten', 'aelrkna erglknnarg']
dt_str = ",".join(dt)
dt_num = re.sub("\\D", "", dt_str)
print(dt_num)
# 400
sample.py
import re
dt = ['regr111kaer', 'gg443nkq', 'laen56nktgar', 'er39fkl', '400 Registranten', 'ael09narg']
dt_str = ",".join(dt)
dt_num = re.sub("\\D", "", dt_str)
print(dt_num)
# 111443563940009
sample.py
import re
dt = ['regr111kaer', 'gg443nkq', 'laen56nktgar', 'er39fkl', '400 Registranten', 'ael09narg']
dt_pop = (dt.pop(4))
dt_num = re.sub("\\D", "", dt_pop)
print(dt_num)
# 400
Referenz https://qiita.com/sakamossan/items/161db7418ade037f6f3d https://qiita.com/ikanamazu/items/ba2a32a1a5924f3bd8e9
Recommended Posts