Environnement d'apprentissage pratique pour les débutants en science des données "Data Science 100 Knock (Structured Data Processing)" publié gratuitement sur GitHub https://digitalpr.jp/r/39499

J'essaierai ceci. Au fait, je ne connais pas du tout R, donc je ne pense pas que je vais le faire.

environnement

・ Windows10 ・ Docker pour ordinateur de bureau ・ Git

Environnement

Démarrer Docker

 wsl -e docker-desktop

Cloner depuis Git

git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git

Construire Docker

cd 100knocks-preprocess
docker-compose up -d --build

Cela prendra un moment ... Quelque chose est tombé ...

Précautions pour la construction de l'environnement

Si vous utilisez Docker Toolbox, l'URL d'accès changera. http://192.168.99.100:8888 L'hôte lors de l'accès à la base de données à l'aide de l'outil client change également.

Confirmation de l'environnement à 100 coups

Accès ci-dessous http://localhost:8888

Un écran comme celui-ci devrait s'ouvrir

Lorsque vous ouvrez work / preprocess_knock_SQL.ipynb

Il y a un problème SQL comme celui-ci. La même chose est vraie pour Python et R, et il semble y avoir une réponse dans le dossier anser. DB est Postgre12.

Ce n'est pas si difficile, mais lorsqu'on lui demande de le normaliser au 3, ça va ...? Je google pendant un moment w

prime

Cet environnement semble utiliser *** Jupyter Notebook ***. Je pensais que je la regarderais beaucoup, mais je ne le savais pas, alors je l'ai recherchée.

Jupyter notebook est l'un des projets Jupyter et est une application Web OSS. Le projet Jupyter est un projet de développement de services et d'OSS pour réaliser une exécution de traitement interactif dans plusieurs langues. Et vous pouvez gérer le résultat de l'exécution du programme collectivement.

Il semble que * .ipynb crée cet écran avec l'extension, et quand j'ai ouvert l'intérieur, c'était le fichier au format json suivant.

`Entity_Relationship.ipynb`


{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#Conception logique DB (diagramme ER)\n",
    "-Certaines données FK peuvent avoir des données qui n'existent pas dans la table maître.\n",
    "-Exemple) L'ID client non membre n'est pas inclus dans le tableau des clients\n",
    "-Par conséquent, les informations FK ne répondent pas aux contraintes de référence externe dans une base de données typique.\n",
    "-Veuillez l'utiliser comme information de référence lors de la combinaison de données"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![Diagramme ER](data/100knocks_ER.png\"échantillon\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}

référence

Cahier Jupyter https://qiita.com/szk3/items/920fd3e905ed16469780

[PYTHON] Essayez «100 coups sur la science des données» ①