Der Inhalt der Datenanalysepraxis "Data Science 100 Knock (Strukturierte Datenverarbeitung)" wurde von der Data Scientist Association veröffentlicht. Da zum Verschieben eine Docker-Operation erforderlich ist, lasse ich eine Methode zum Verschieben mit Colaboratory für diejenigen, die es zum ersten Mal problemlos sehen möchten.
Erstellen Sie zunächst ein geeignetes Notizbuch und öffnen Sie das Labor. Führen Sie nach dem Öffnen den folgenden Befehl aus, um die Daten auf Google Drive herunterzuladen.
from google.colab import drive
drive.mount('/content/drive')
!git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git 'drive/My Drive/100knocks-preprocess'
Wenn Sie das Laufwerk zum ersten Mal mounten, wird unter der von Ihnen ausgeführten Zelle die folgende Anzeige angezeigt. Klicken Sie auf die URL, um Zugriff auf das Laufwerk von Google Colaboratory zu gewähren. Am Ende wird die Meldung "Bitte kopieren Sie diesen Code, wechseln Sie zur Anwendung und fügen Sie ihn ein." Angezeigt. Fügen Sie den kopierten Code in das Feld "Geben Sie Ihren Autorisierungscode ein:" oben ein und führen Sie ihn aus. Wenn Sie zu Mein Laufwerk zurückkehren, wird ein Ordner mit dem Namen "100 Knocks-Preprocess" angezeigt. Wenn alles gut geht, werde ich dieses Notebook nicht mehr verwenden.
Die Notebook-Datei wird im folgenden Verzeichnis gespeichert. Öffnen wir preprocess_knock_Python.ipynb in Google Colabatory.
Wenn Sie die erste Zelle so ausführen, wie sie ist, tritt ein Fehler auf. Wenn Sie also nur die Bibliothek importieren, laden wir die Daten mit dem folgenden Code
def get_df(filename):
path = 'drive/My Drive/100knocks-preprocess/docker/work/data'
return pd.read_csv(os.path.join(path, filename))
df_customer = get_df('customer.csv')
df_category = get_df('category.csv')
df_geocode = get_df('geocode.csv')
df_product = get_df('product.csv')
df_receipt = get_df('receipt.csv')
df_store = get_df('store.csv')
Übrigens gibt es eine PDF-Datei, die das Ziel dieses Inhalts im folgenden Ordner erklärt. Es scheint also gut, ihn zu lesen, bevor Sie daran arbeiten.
100knocks-preprocess/docker/dock
Jetzt bist du bereit Wenn Sie es nach einer Weile ausführen, verlieren Sie möglicherweise die Verbindung zum Laufwerk. (Möglicherweise ...) Führen Sie in diesem Fall den folgenden Code erneut aus, oder hängen Sie das Laufwerk über die Seitenleiste an und laden Sie die Daten erneut.
from google.colab import drive
drive.mount('/content/drive')
Während ich diesen Artikel schrieb, ist das Erstellen einer Umgebung mit Docker nicht so schwierig, und es ist oft nützlich, dies zu tun. Ich denke, es ist gut, diese Gelegenheit zu nutzen, um herauszufordern. Der Artikel hier scheint gut für das Bauen auf einem Mac zu sein. Wenn Sie eine Umgebung erstellen können, können Sie SQL üben!
Recommended Posts