Environnement d'apprentissage pratique pour les débutants en science des données "Data Science 100 Knock (Structured Data Processing)" publié gratuitement sur GitHub https://digitalpr.jp/r/39499
J'essaierai ceci. Au fait, je ne connais pas du tout R, donc je ne pense pas que je vais le faire.
・ Windows10 ・ Docker pour ordinateur de bureau ・ Git
Démarrer Docker
wsl -e docker-desktop
Cloner depuis Git
git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
Construire Docker
cd 100knocks-preprocess
docker-compose up -d --build
Cela prendra un moment ... Quelque chose est tombé ...
Si vous utilisez Docker Toolbox, l'URL d'accès changera. http://192.168.99.100:8888 L'hôte lors de l'accès à la base de données à l'aide de l'outil client change également.
Accès ci-dessous http://localhost:8888
Un écran comme celui-ci devrait s'ouvrir
Lorsque vous ouvrez work / preprocess_knock_SQL.ipynb
Il y a un problème SQL comme celui-ci. La même chose est vraie pour Python et R, et il semble y avoir une réponse dans le dossier anser. DB est Postgre12.
Ce n'est pas si difficile, mais lorsqu'on lui demande de le normaliser au 3, ça va ...? Je google pendant un moment w
Cet environnement semble utiliser *** Jupyter Notebook ***. Je pensais que je la regarderais beaucoup, mais je ne le savais pas, alors je l'ai recherchée.
Jupyter notebook est l'un des projets Jupyter et est une application Web OSS. Le projet Jupyter est un projet de développement de services et d'OSS pour réaliser une exécution de traitement interactif dans plusieurs langues. Et vous pouvez gérer le résultat de l'exécution du programme collectivement.
Il semble que * .ipynb crée cet écran avec l'extension, et quand j'ai ouvert l'intérieur, c'était le fichier au format json suivant.
Entity_Relationship.ipynb
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#Conception logique DB (diagramme ER)\n",
"-Certaines données FK peuvent avoir des données qui n'existent pas dans la table maître.\n",
"-Exemple) L'ID client non membre n'est pas inclus dans le tableau des clients\n",
"-Par conséquent, les informations FK ne répondent pas aux contraintes de référence externe dans une base de données typique.\n",
"-Veuillez l'utiliser comme information de référence lors de la combinaison de données"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"![Diagramme ER](data/100knocks_ER.png\"échantillon\")"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.6"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
Cahier Jupyter https://qiita.com/szk3/items/920fd3e905ed16469780
Recommended Posts