[PYTHON] Essayez «100 coups sur la science des données» ①

Environnement d'apprentissage pratique pour les débutants en science des données "Data Science 100 Knock (Structured Data Processing)" publié gratuitement sur GitHub https://digitalpr.jp/r/39499

J'essaierai ceci. Au fait, je ne connais pas du tout R, donc je ne pense pas que je vais le faire.

environnement

・ Windows10 ・ Docker pour ordinateur de bureau ・ Git

Environnement

Démarrer Docker

 wsl -e docker-desktop

Cloner depuis Git

git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git

Construire Docker

cd 100knocks-preprocess
docker-compose up -d --build

Cela prendra un moment ... Quelque chose est tombé ...

Précautions pour la construction de l'environnement

Si vous utilisez Docker Toolbox, l'URL d'accès changera. http://192.168.99.100:8888 L'hôte lors de l'accès à la base de données à l'aide de l'outil client change également.

Confirmation de l'environnement à 100 coups

Accès ci-dessous http://localhost:8888

image.png

Un écran comme celui-ci devrait s'ouvrir

Lorsque vous ouvrez work / preprocess_knock_SQL.ipynb

image.png

Il y a un problème SQL comme celui-ci. La même chose est vraie pour Python et R, et il semble y avoir une réponse dans le dossier anser. DB est Postgre12.

Ce n'est pas si difficile, mais lorsqu'on lui demande de le normaliser au 3, ça va ...? Je google pendant un moment w

prime

Cet environnement semble utiliser *** Jupyter Notebook ***. Je pensais que je la regarderais beaucoup, mais je ne le savais pas, alors je l'ai recherchée.

Jupyter notebook est l'un des projets Jupyter et est une application Web OSS. Le projet Jupyter est un projet de développement de services et d'OSS pour réaliser une exécution de traitement interactif dans plusieurs langues. Et vous pouvez gérer le résultat de l'exécution du programme collectivement.

Il semble que * .ipynb crée cet écran avec l'extension, et quand j'ai ouvert l'intérieur, c'était le fichier au format json suivant.

Entity_Relationship.ipynb


{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#Conception logique DB (diagramme ER)\n",
    "-Certaines données FK peuvent avoir des données qui n'existent pas dans la table maître.\n",
    "-Exemple) L'ID client non membre n'est pas inclus dans le tableau des clients\n",
    "-Par conséquent, les informations FK ne répondent pas aux contraintes de référence externe dans une base de données typique.\n",
    "-Veuillez l'utiliser comme information de référence lors de la combinaison de données"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![Diagramme ER](data/100knocks_ER.png\"échantillon\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}

référence

Cahier Jupyter https://qiita.com/szk3/items/920fd3e905ed16469780

Recommended Posts

Essayez «100 coups sur la science des données» ①
Défiez 100 coups de science des données
[Python] 100 coups sur la science des données (traitement de données structurées) 018 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 023 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 017 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 026 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 016 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 024 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 027 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 029 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 015 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 028 Explication
Apprenez la science des données
Livres sur la science des données à lire en 2020
Préparation à l’essai de «Data Science 100 Knock (traitement des données structurées)»
Essayez d'importer des données MLB sur Mac et Python
Essayez FEniCS sur Windows!
Essayez Poerty sur Windows
Concours de science des données OPT
Essayez deepdream sur Mac
Essayez une analyse rudimentaire des sentiments sur les données de l'API Twitter Stream.
Data Science 100 Knock ~ Battle pour moins que les débutants part10
Science des données 100 coups ~ Bataille pour moins que les débutants part8
Essayez de traduire le manuel de science des données Python en japonais
Commentaire sur la science des données à 100 coups (P021 ~ 040)
Commentaire sur la science des données à 100 coups (P061 ~ 080)
Essayez StyleGAN avec Google Colaboratory
Essayez d'accéder aux données AWS Redshift à l'aide d'Oracle Cloud Infrastructure Data Science
Commentaire de la science des données 100 coups (P041 ~ 060)
Essayez d'utiliser OpenCV sur Windows
Fiche technique de la science des données (Python)
Comment mettre en œuvre 100 coups de science des données pour les débutants en science des données (pour Windows 10 Home)
[Python] Notes sur l'analyse des données
Dockerfile pour créer un environnement de science des données basé sur pip3
Sortie du cours Infra_Data Science
Essayez l'augmentation de l'effacement aléatoire des données
Pandas 100 coups sur Google Colaboratory
J'ai essayé AdaNet pour les données de table
Essayez d'exécuter tensorflow sur Docker + anaconda
Essayez d'utiliser Pillow sur iPython (partie 1)
Essayez d'installer OpenAM sur Amazon Linux
Essayez d'utiliser Pillow sur iPython (partie 2)
Essayez d'implémenter k-NN par vous-même
Présentation de livres liés à la science des données.
Essayez de mettre des données dans MongoDB
Essayez Ajax sur la page Django
Essayez d'utiliser Pillow sur iPython (partie 3)
Installez le fabric sur Ubuntu et essayez
[Bases de la science des données] Acquisition de données à partir de l'API
Essayez d'exécuter Jupyter Notebook sur Mac
Essayez les données en parallèle avec TensorFlow distribué
Essayez d'installer OpenCV 3.0 sur l'AMI