Die Data Scientist Association hat ** "Data Science 100 Knock (Strukturierte Datenverarbeitung)" ** veröffentlicht, eine kostenlose Lernumgebung, in der Sie praktisch die Verarbeitung strukturierter Daten [auf GitHub] lernen können (https: / /github.com/The-Japan-DataScientist-Society/100knocks-preprocess). Dieser Artikel beschreibt die Details des Einführungsverfahrens, damit auch Anfänger eine kostenlose Lernumgebung erstellen können. (Die zu erstellende Ausführungsumgebung ist in der folgenden Abbildung dargestellt.)
> git config --global core.autocrlf input
Erstellen Sie ein Verzeichnis für die Lernumgebung (diesmal dss) und klonen Sie ein 100-Knock-Repository.
Wechseln Sie dann in das 100-Knock-Verzeichnis und erstellen Sie mit dem Befehl docker-compose
einen Container. (Es dauert ungefähr 10 Minuten.)
> mkdir dss
> cd dss
> git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
> cd 100knocks-preprocess
> docker-compose up -d --build
Wenn Sie die gestarteten Container und die Ausgabe von ** "dss-notebook" ** und ** "dss-postgres" ** überprüfen können, ist die Umgebungskonstruktion erfolgreich.
> docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
b35f99d4148a dss-notebook "tini -g -- start-no…" 23 seconds ago Up 22 seconds 0.0.0.0:8888->8888/tcp dss-notebook
3cb559c7f66d dss-postgres "docker-entrypoint.s…" 27 seconds ago Up 26 seconds 0.0.0.0:5432->5432/tcp dss-postgres
Sie können auf die erstellte Jupyter-Umgebung zugreifen, indem Sie mit einem Browser auf die folgende URL zugreifen.
http://localhost:8888
Unter dem Verzeichnis work
befindet sich eine .ipynb-Datei für Übungen zur strukturierten Datenverarbeitung.
** Der Import der erforderlichen Bibliothek und die Datenerfassung vor der Verarbeitung sind bereits in der ersten Zelle beschrieben. ** **.
Geben Sie den für die Übung geeigneten Prozess in die leere Zelle ein und führen Sie ihn aus, um mit dem Lernen fortzufahren.
Die Antwort auf die Übung ist eine .ipynb-Datei im Verzeichnis work / answer
.
Daher können Sie arbeiten, während Sie die Richtigkeit der in der Übungsdatei beantworteten Verarbeitung überprüfen.
Sie können die erstellte Umgebung mit dem folgenden Befehl stoppen.
> docker-compose stop
Wenn Sie es nach dem zweiten Mal starten möchten, können Sie es auch mit dem folgenden Befehl starten.
> docker-compose start
Ändern Sie den Speicherwert von Ressourcen in den Einstellungen von Docker Desktop für Windows. Die Empfehlung lautet 4,00 GB oder mehr.
Wenn Sie den 8888-Port des lokalen Hosts in einer anderen Entwicklungsumgebung (LAMP usw.) verwenden, können Sie dies tun, indem Sie docker-compose.yml wie folgt ändern (den Wert der Ports in Notebook ändern).
docker-compose.yml
notebook:
ports:
- "888:8888"
Im obigen Fall ist es unter der folgenden URL zugänglich.
http://localhost:888
Beschrieb das Umgebungskonstruktionsverfahren für 100 Datenwissenschaftler (strukturierte Datenverarbeitung) in der Windows 10-Umgebung. Wenn Sie Fragen oder Bedenken bezüglich des oben genannten Verfahrens haben, würden wir uns freuen, wenn Sie dies kommentieren könnten.
Leitfaden zu 100 Schlägen in der Datenwissenschaft
Recommended Posts