[PYTHON] Ich möchte 100 Datenwissenschaften mit Colaboratory schlagen

Der Inhalt der Datenanalysepraxis "Data Science 100 Knock (Strukturierte Datenverarbeitung)" wurde von der Data Scientist Association veröffentlicht. Da zum Verschieben eine Docker-Operation erforderlich ist, lasse ich eine Methode zum Verschieben mit Colaboratory für diejenigen, die es zum ersten Mal problemlos sehen möchten.

1. Laden Sie die Daten herunter

Erstellen Sie zunächst ein geeignetes Notizbuch und öffnen Sie das Labor. Führen Sie nach dem Öffnen den folgenden Befehl aus, um die Daten auf Google Drive herunterzuladen.

from google.colab import drive
drive.mount('/content/drive')

!git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git 'drive/My Drive/100knocks-preprocess'

Wenn Sie das Laufwerk zum ersten Mal mounten, wird unter der von Ihnen ausgeführten Zelle die folgende Anzeige angezeigt. Klicken Sie auf die URL, um Zugriff auf das Laufwerk von Google Colaboratory zu gewähren. スクリーンショット 2020-06-17 9.45.24.png Am Ende wird die Meldung "Bitte kopieren Sie diesen Code, wechseln Sie zur Anwendung und fügen Sie ihn ein." Angezeigt. Fügen Sie den kopierten Code in das Feld "Geben Sie Ihren Autorisierungscode ein:" oben ein und führen Sie ihn aus. Wenn Sie zu Mein Laufwerk zurückkehren, wird ein Ordner mit dem Namen "100 Knocks-Preprocess" angezeigt. Wenn alles gut geht, werde ich dieses Notebook nicht mehr verwenden.

2. Öffnen Sie Jupyter Notebook von My Drive

Die Notebook-Datei wird im folgenden Verzeichnis gespeichert. スクリーンショット 2020-06-17 10.04.05.png Öffnen wir preprocess_knock_Python.ipynb in Google Colabatory.

3. Versuchen Sie sich zu bewegen

Wenn Sie die erste Zelle so ausführen, wie sie ist, tritt ein Fehler auf. Wenn Sie also nur die Bibliothek importieren, laden wir die Daten mit dem folgenden Code

def get_df(filename):
  path = 'drive/My Drive/100knocks-preprocess/docker/work/data'
  return pd.read_csv(os.path.join(path, filename))

df_customer = get_df('customer.csv')
df_category = get_df('category.csv')
df_geocode = get_df('geocode.csv')
df_product = get_df('product.csv')
df_receipt = get_df('receipt.csv')
df_store = get_df('store.csv')

Übrigens gibt es eine PDF-Datei, die das Ziel dieses Inhalts im folgenden Ordner erklärt. Es scheint also gut, ihn zu lesen, bevor Sie daran arbeiten. 100knocks-preprocess/docker/dock

Jetzt bist du bereit Wenn Sie es nach einer Weile ausführen, verlieren Sie möglicherweise die Verbindung zum Laufwerk. (Möglicherweise ...) Führen Sie in diesem Fall den folgenden Code erneut aus, oder hängen Sie das Laufwerk über die Seitenleiste an und laden Sie die Daten erneut.

from google.colab import drive
drive.mount('/content/drive')

das ist alles

Während ich diesen Artikel schrieb, ist das Erstellen einer Umgebung mit Docker nicht so schwierig, und es ist oft nützlich, dies zu tun. Ich denke, es ist gut, diese Gelegenheit zu nutzen, um herauszufordern. Der Artikel hier scheint gut für das Bauen auf einem Mac zu sein. Wenn Sie eine Umgebung erstellen können, können Sie SQL üben!

Recommended Posts

Ich möchte 100 Datenwissenschaften mit Colaboratory schlagen
Ich möchte ○○ mit Pandas machen
Ich möchte mit Python debuggen
Ich möchte Daten mit Python analysieren können (Teil 3)
Ich möchte Daten mit Python analysieren können (Teil 1)
Ich möchte Daten mit Python analysieren können (Teil 4)
Ich möchte Daten mit Python analysieren können (Teil 2)
Ich möchte Objekte mit OpenCV erkennen
Ich möchte einen Blog mit Jupyter Notebook schreiben
Ich möchte eine Pip-Installation mit PythonAnywhere durchführen
Ich möchte Protokolle mit Python analysieren
Ich möchte mit aws mit Python spielen
Ich möchte MATLAB feval mit Python verwenden
Ich habe versucht, die Daten mit Zwietracht zu speichern
Wie auch immer, ich möchte JSON-Daten einfach überprüfen
Ich möchte mehrere Bilder mit matplotlib anzeigen.
Ich möchte ein Spiel mit Python machen
Ich möchte OREMO mit setParam sein!
Ich habe versucht, CloudWatch-Daten mit Python abzurufen
Ich möchte Temporäres Verzeichnis mit Python2 verwenden
Ich möchte die Daten von League of Legends ③ erhalten
Ich möchte die Daten von League of Legends ② erhalten
Ich möchte -inf nicht mit np.log verwenden
#Unresolved Ich möchte Gobject-Introspection mit Python3 kompilieren
Ich möchte ip vrf mit SONiC verwenden
Ich möchte APG4b mit Python lösen (Kapitel 2)
Ich möchte mit Djangos Migrate von vorne beginnen
Ich möchte League of Legends-Daten erhalten ①
Ich möchte mit Python in eine Datei schreiben
Fühlen Sie sich frei, 100 Datenwissenschaften mit Google Colab und Azure Notebooks zu schlagen!
Ich möchte ein Bild mit Lollipop in WebP konvertieren
Ich möchte einem Pandas-Datenrahmen eine group_id geben
Ich möchte die Optimierung mit Python und CPlex behandeln
Ich möchte mit verstärkendem Lernen einen Berg besteigen
Ich möchte mit Python-Datenklasse nach hinten erben
Ich möchte mit einem Roboter in Python arbeiten.
Ich möchte eine Zeichenkette mit Hiragana teilen
Ich möchte Lambda mit Python auf Mac AWS!
Ich möchte manuell eine Legende mit matplotlib erstellen
[TensorFlow] Ich möchte Fenster mit Ragged Tensor verarbeiten
Ich möchte sagen, dass es eine Datenvorverarbeitung gibt ~
Ich möchte einen Quantencomputer mit Python betreiben
Ich möchte eine lokale Variable mit Lambda binden
Ich möchte SUDOKU lösen
Ich möchte Pythons ungelöste Importwarnung mit vsCode entfernen
Ich möchte R-Funktionen einfach mit ipython notebook verwenden
Ich möchte eine andere Version von Python mit pyvenv angeben
Ich habe versucht, mit Python faker verschiedene "Dummy-Daten" zu erstellen
Ich möchte einen Blog-Editor mit dem Administrator von Django erstellen
Ich möchte eine Jupyter-Umgebung mit einem Befehl starten
[NetworkX] Ich möchte nach Knoten mit bestimmten Attributen suchen
Ich möchte ein Klickmakro mit pyautogui (Wunsch) erstellen.
Ich möchte mit Numpy die japanische Flagge in die Palau-Flagge ändern
Ich möchte mit GAN Schwarzweißfotos von Erinnerungen ausmalen
Ich möchte automatisch an Online-Kursen mit Python + Selen teilnehmen!
Ich möchte ein Klickmakro mit pyautogui (Outlook) erstellen.
[Python] Ich möchte die Option -h mit argparse verwenden