[PYTHON] Versuchen Sie "100 Schläge auf Data Science" ①

Praktische Lernumgebung für Data Science-Anfänger "Data Science 100 Knock (Strukturierte Datenverarbeitung)" wird kostenlos auf GitHub veröffentlicht https://digitalpr.jp/r/39499

Ich werde es versuchen. Übrigens kenne ich R überhaupt nicht, also glaube ich nicht, dass ich es tun werde.

Umgebung

・ Windows10 ・ Docker für Desktop ・ Git

Umgebung

Starten Sie Docker

 wsl -e docker-desktop

Klon von Git

git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git

Erstellen Sie Docker

cd 100knocks-preprocess
docker-compose up -d --build

Es wird eine Weile dauern ... Etwas wird fallen gelassen ...

Vorsichtsmaßnahmen für den Umweltbau

Wenn Sie Docker Toolbox verwenden, ändert sich die Zugriffs-URL. http://192.168.99.100:8888 Der Host beim Zugriff auf die Datenbank mit dem Client-Tool ändert sich ebenfalls.

Bestätigung der 100-Klopf-Umgebung

Zugang unten http://localhost:8888

image.png

Ein Bildschirm wie dieser sollte sich öffnen

Wenn Sie work / preprocess_knock_SQL.ipynb öffnen

image.png

Es gibt ein solches SQL-Problem. Das gleiche gilt für Python und R, und im anser-Ordner scheint es eine Antwort zu geben. DB ist Postgre12.

Es ist nicht so schwierig, aber wenn man darum gebeten wird, es auf den 3. zu normalisieren, ist es okay ...? Ich google für einen Moment w

Bonus

Diese Umgebung scheint *** Jupyter Notebook *** zu verwenden. Ich dachte, ich würde es mir viel ansehen, aber ich wusste es nicht, also habe ich es nachgeschlagen.

Jupyter Notebook ist eines der Jupyter-Projekte und eine OSS-Webanwendung. Das Jupyter-Projekt ist ein Projekt zur Entwicklung von Diensten und OSS zur Realisierung einer interaktiven Verarbeitungsausführung in mehreren Sprachen. Und Sie können das Ausführungsergebnis des Programms gemeinsam verwalten.

Es scheint, dass * .ipynb diesen Bildschirm mit der Erweiterung erstellt, und als ich das Innere öffnete, war es die folgende Datei im JSON-Format.

Entity_Relationship.ipynb


{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "#Logisches DB-Design (ER-Diagramm)\n",
    "-Einige Daten, die FK sind, enthalten möglicherweise Daten, die in der Mastertabelle nicht vorhanden sind.\n",
    "-Beispiel) Die Kunden-ID eines Nichtmitglieds ist nicht in der Kundentabelle enthalten\n",
    "-Daher erfüllen die FK-Informationen nicht die externen Referenzbeschränkungen in einer typischen Datenbank.\n",
    "-Bitte verwenden Sie es als Referenzinformation beim Kombinieren von Daten"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![ER-Diagramm](data/100knocks_ER.png\"Stichprobe\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}

Referenz

Jupyter-Notizbuch https://qiita.com/szk3/items/920fd3e905ed16469780

Recommended Posts

Versuchen Sie "100 Schläge auf Data Science" ①
Fordern Sie 100 Data Science-Schläge heraus
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 018 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 023 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 017 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 026 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 016 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 024 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 027 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 029 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 015 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 028 Erläuterung
Lernen Sie Data Science
Bücher über Datenwissenschaft, die 2020 gelesen werden sollen
Vorbereitung zum Versuch "Data Science 100 Knock (Strukturierte Datenverarbeitung)"
Versuchen Sie, MLB-Daten auf Mac und Python zu importieren
Probieren Sie FEniCS unter Windows aus!
Versuchen Sie Poerty unter Windows
OPT Data Science Wettbewerb
Versuchen Sie Deepdream auf dem Mac
Versuchen Sie eine rudimentäre Stimmungsanalyse für Twitter Stream API-Daten.
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil10
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil8
Versuchen Sie, das Python Data Science-Handbuch ins Japanische zu übersetzen
Data Science 100 Klopfkommentar (P021 ~ 040)
Data Science 100 Klopfkommentar (P061 ~ 080)
Probieren Sie StyleGAN mit Google Colaboratory aus
Versuchen Sie, mit Oracle Cloud Infrastructure Data Science auf AWS Redshift-Daten zuzugreifen
Data Science 100 Klopfkommentar (P041 ~ 060)
Versuchen Sie es mit OpenCV unter Windows
Data Science Cheet Sheet (Python)
Implementieren von 100 Data Science-Schlägen für Anfänger in Data Science (für Windows 10 Home)
[Python] Hinweise zur Datenanalyse
Dockerfile zum Erstellen einer datenwissenschaftlichen Umgebung basierend auf pip3
Infra_Data Science Course Output
Versuchen Sie die zufällige Löschung von Daten
Pandas 100 klopft an Google Colaboratory
Ich habe AdaNet gegen Tabellendaten ausprobiert
Versuchen Sie, Tensorflow auf Docker + Anaconda auszuführen
Versuchen Sie es mit Pillow auf iPython (Teil 1)
Versuchen Sie, OpenAM unter Amazon Linux zu installieren
Versuchen Sie es mit Pillow auf iPython (Teil 2)
Versuchen Sie, k-NN selbst zu implementieren
Einführung in datenwissenschaftliche Bücher.
Versuchen Sie, Daten in MongoDB abzulegen
Probieren Sie Ajax auf der Django-Seite aus
Versuchen Sie es mit Pillow auf iPython (Teil 3).
Installieren Sie Fabric unter Ubuntu und versuchen Sie es
[Data Science-Grundlagen] Datenerfassung über API
Versuchen Sie, Jupyter Notebook auf einem Mac auszuführen
Versuchen Sie Daten parallel zu Distributed TensorFlow
Versuchen Sie, OpenCV 3.0 auf dem AMI zu installieren