[PYTHON] Lesen und Schreiben durch Komprimieren von Variablen wie DataFrame mit joblib anstelle von pickle

Es ist besser, einen großen DataFrame mit pickle zu speichern. Wenn es sich beim Hochladen auf git um pickle handelte, ist es aufgrund der Kapazität möglicherweise nicht möglich, einen Push durchzuführen. Aus diesem Grund habe ich beschlossen, es mit joblib zu komprimieren und die Daten auch in git zu verwalten.

Beim Speichern und Laden mit Gurke

save_pickle.py



import pandas as pd
df = pd.DataFrame([1,2,3])
df.to_pickle('df.pickle')

read_pickle.py


import pandas as pd

df = pd.read_pickle('df.pickle')

Klicken Sie hier, um mit joblib zu speichern und zu laden. Sie können das Komprimierungsverhältnis mit komprimieren ändern. Wenn Sie zu viel komprimieren, dauert das Komprimieren und Lesen einige Zeit In meinem Fall schien 4 gut zu sein.

save_joblib.py



import pandas as pd
import joblib

df = pd.DataFrame([1,2,3])
joblib.dump(df, 'df.joblib', compress=4)

read_joblib.py


import pandas as pd
import joblib

df = joblib.load('df.joblib')

Recommended Posts

Lesen und Schreiben durch Komprimieren von Variablen wie DataFrame mit joblib anstelle von pickle
Lesen Sie die CSV-Datei mit Python und konvertieren Sie sie unverändert in DataFrame
Vergleichen Sie die Lese- / Schreibgeschwindigkeit und Kapazität von CSV, Pickle, Joblib und Parkett in einer Python-Umgebung
Lesen von Originaldaten oder externen Daten im Internet mit scikit-learn anstelle eines angehängten Datensatzes wie Iris
So aktivieren Sie das Lesen / Schreiben von net.Conn mit golang, um mit dem Kontext abzubrechen
Binden Sie an die Klasse, um YAML zu lesen und zu schreiben
Lesen und Schreiben von CSV-Dateien mit Numpy
Komprimieren Sie Python-Daten und schreiben Sie in SQLite
Lesen Sie JSON mit Python und geben Sie CSV aus
Skript zum Twittern mit Vielfachen von 3 und Zahlen mit 3 !!
[Python3] Lesen und Schreiben mit datetime isoformat mit json
Lesen Sie die CSV-Datei mit dem Jupiter-Notizbuch und schreiben Sie die Grafik übereinander
Ich habe versucht, mit VOICEROID2 2 automatisch zu lesen und zu speichern
Ich habe versucht, mit VOICEROID2 automatisch zu lesen und zu speichern
Lesen und Schreiben von Dateien mit Slackbot ~ Bot-Entwicklung mit Python ~
[Grafikzeichnung] Ich habe versucht, ein mehrreihiges Balkendiagramm mit Matplotlib und Seaborn zu schreiben