La Data Scientist Association a publié ** "Data Science 100 Knock (Structured Data Processing)" **, un environnement d'apprentissage gratuit où vous pouvez apprendre pratiquement le traitement des données structurées [sur GitHub](https: / /github.com/The-Japan-DataScientist-Society/100knocks-preprocess). Cet article décrit les détails de la procédure d'introduction afin que même les débutants puissent créer un environnement d'apprentissage gratuit. (L'environnement d'exécution à générer est illustré dans la figure ci-dessous.)
> git config --global core.autocrlf input
Créez un répertoire pour l'environnement d'apprentissage (dss cette fois) et clonez un référentiel à 100 coups.
Déplacez-vous ensuite dans le répertoire 100 knock et utilisez la commande docker-compose
pour créer un conteneur. (Cela prend environ 10 minutes.)
> mkdir dss
> cd dss
> git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
> cd 100knocks-preprocess
> docker-compose up -d --build
Si vous pouvez vérifier le conteneur démarré et vérifier la sortie de ** "dss-notebook" ** et ** "dss-postgres" **, la construction de l'environnement est réussie.
> docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
b35f99d4148a dss-notebook "tini -g -- start-no…" 23 seconds ago Up 22 seconds 0.0.0.0:8888->8888/tcp dss-notebook
3cb559c7f66d dss-postgres "docker-entrypoint.s…" 27 seconds ago Up 26 seconds 0.0.0.0:5432->5432/tcp dss-postgres
Vous pouvez accéder à l'environnement Jupyter intégré en accédant à l'URL suivante avec un navigateur.
http://localhost:8888
Sous le répertoire work
, il y a un fichier .ipynb pour les exercices de traitement de données structurées.
** L'importation de la bibliothèque requise et l'acquisition des données avant le traitement sont déjà décrites dans la première cellule. ** **
Entrez le processus adapté à l'exercice dans la cellule vide et exécutez-le pour poursuivre l'apprentissage.
La réponse à l'exercice est un fichier .ipynb dans le répertoire work / answer
.
Par conséquent, vous pouvez travailler en vérifiant l'exactitude du traitement répondu dans le fichier d'exercice.
Vous pouvez arrêter l'environnement construit avec la commande suivante.
> docker-compose stop
De plus, si vous souhaitez le démarrer après la deuxième fois, vous pouvez le démarrer avec la commande suivante.
> docker-compose start
Modifiez la valeur de la mémoire des ressources dans les paramètres de Docker Desktop pour Windows. La recommandation est 4,00 Go ou plus.
Si vous utilisez le port 8888 de l'hôte local dans un autre environnement de développement (LAMP, etc.), vous pouvez le gérer en modifiant docker-compose.yml comme suit (en modifiant la valeur des ports dans notebook).
docker-compose.yml
notebook:
ports:
- "888:8888"
Dans le cas ci-dessus, il sera accessible à l'URL suivante.
http://localhost:888
Décrit la procédure de construction de l'environnement pour 100 coups de science des données (traitement de données structurées) dans l'environnement Windows 10. Si vous avez des questions ou des préoccupations concernant la procédure ci-dessus, nous vous serions reconnaissants de bien vouloir commenter.
Guide à 100 coups dans la science des données
Recommended Posts