[PYTHON] Implementieren von 100 Data Science-Schlägen für Anfänger in Data Science (für Windows 10 Home)
Einführung
Vor kurzem verwende ich verschiedene externe Python-Bibliotheken wie Pandas und Numpy, weil ich ein privates Datenanalysetool erstelle. Wenn ich es jedoch für die Datenanalyse verwende, "Ich weiß nicht!", Stechen mein Kopf und ich könnte den PC in ein Basketballtor eintauchen. </ b>
Ich fand das schlecht und als ich nach guten Unterrichtsmaterialien suchte, fand ich eine Lernumgebung "Data Science 100 Knock" für Datenwissenschaftler.
Zu diesem Zeitpunkt wurde in diesem Artikel der Prozess veröffentlicht, bis ich "Data Science 100 Knock" unter Windows implementiert habe.
Was ist Data Science 100 Knock überhaupt?
Data Science 100 Knock ist eine kostenlose Lernumgebung, die von der Data Scientist Association (im Folgenden als DS Association bezeichnet) auf GitHub bereitgestellt wird und in der Sie praktisch mehr über die Verarbeitung strukturierter Daten erfahren können. Es ist ein sehr effektives Lernwerkzeug für Anfänger von Datenwissenschaftlern.
Es ist möglich, das Grundwissen einer Vielzahl von Datenwissenschaftlern zu erlernen, darunter R, eine auf statistische Analyse spezialisierte Programmiersprache, und SQL, eine Datenbanksprache, sowie die Programmiersprache Python, die für KI und maschinelles Lernen bekannt ist.
Über die Vorbereitung
Vor dem Aufbau der Umgebung wird das Gerät unter den folgenden Bedingungen vorbereitet.
- windows 10 home
: Verwendetes Betriebssystem (beschrieben, da es in den Docker Toolbox-Einstellungen wichtig ist) li>
- Docker Toolbox
: Tools zum Erstellen einer virtuellen Umgebung unter Windows li>
- git
: Erforderlich zum Klonen der Einstellungsdateigruppe (Containergruppe), die die virtuelle Umgebung zum Lernen von "Data Science 100 Knock" von GitHub li> bereitstellt
Data Science 100 Klopfumgebung Konstruktionsmethode
Es gibt zwei Hauptaufgaben.
- Docker Toolbox Setup li>
- Aufbau einer Lernumgebung für "100 Schläge Data Science" li>
Ich werde jeden von ihnen erklären.
### Docker Toolbox-Setup
Um "Data Science 100 Knock" verwenden zu können, müssen Sie eine dedizierte Umgebung vorbereiten - eine virtuelle Umgebung - und ein Tool namens Docker installieren, das eine virtuelle Umgebung unter Windows erstellt. Die Vorgehensweise wird hier beschrieben.
- Greifen Sie auf die offizielle Docker-Website zu
https://docs.docker.com/toolbox/overview/
![資料1.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/7c589bc6-9a1f-7a33-3f69-e2d55bf2023f.png)
Laden Sie die Docker Toolbox [* 1] b> von der offiziellen Website herunter (Hinweis: Laden Sie Docker nicht versehentlich für Windows [* 2] hier herunter !!)
* 1: Im Fall von Windows 10 Home laden Sie ein Tool namens Docker Toolbox herunter, das ein "Tool zum Erstellen einer virtuellen Umgebung" von außen enthält, da wir kein Tool namens "Hyper-V" haben, das eine virtuelle Umgebung selbst erstellt. Es gibt Bedarf.
* 2: Laden Sie für Windows 10 Pro Docker für Windows herunter
![資料2.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/837bdcee-1631-4944-0a28-f00166c2695d.png)
- Installieren Sie die heruntergeladene Docker Toolbox. Sofern Sie keine speziellen Einstellungen benötigen, drücken Sie einfach die Grundeinstellung "Weiter>", um die Einstellungen vorzunehmen.
![資料3.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/8a089030-4dda-b1ea-0488-eacf0e9ee838.png)
- Vergewissern Sie sich, dass das folgende Symbol für den Betrieb von Docker angezeigt wird.
![資料4.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/76951122-b6a9-70de-91c8-3e947cb91c21.png)
Doppelklicken Sie auf das Kitematic-Symbol - , um eine virtuelle Docker-Maschine mit dem Namen "default" in der Oracle VM Virtual Box zu erstellen. Warten Sie einen Moment (100%), bis es erstellt wird.
![資料45png.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/4590b9cc-11e6-0270-1d8d-0c1dad8e1c4e.png)
- Wenn der Docker Hub-Anmeldebildschirm angezeigt wird, drücken Sie "JETZT ÜBERSPRINGEN", um ihn zu überspringen. (Sie können jederzeit ein Docker Hub-Konto erstellen, daher werde ich es hier weglassen.)
![資料6png.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/cb492fe1-667f-8e1c-b6ac-b85660307a00.png)
- Klicken Sie unten links auf dem Bildschirm auf "DOCKER CLI", um die Docker-Befehlszeilenschnittstelle zu öffnen.
![資料7png.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/c48fae7d-a4d0-d569-9394-18c5c86ca3b6.png)
- Führen Sie den Befehl ". \ Docker ps" in "DOCKER CLI" aus. (Wenn ein Fehler auftritt, führen Sie den Befehl "docker ps" aus.) Wenn kein Fehler auftritt und eine Liste der Container mit leeren Ergebnissen angezeigt wird, ist die Einrichtung von "Docker Toolbox" abgeschlossen.
![資料8png.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/976321aa-9879-d730-aafb-4af570fe7351.png)
### Aufbau einer Lernumgebung für "100 Schläge Data Science"
Da die von der DS Association bereitgestellte Einstellungsdatei der Lernumgebung von "Data Science 100 Knock" auf GitHub veröffentlicht ist, muss die Einstellungsdatei mit git [*] von Github auf den lokalen PC verschoben werden. Es gibt.
![ogp_thum800.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/681742/044582ea-0f11-9650-9537-6dbae773e0e6.jpeg)
- Informationen zur Funktionsweise von git finden Sie im folgenden Artikel
https://qiita.com/manabu-watanabe/items/ecf1b434baf305adaa00
- Öffnen Sie das Docker-Schnellstartterminal und geben Sie den folgenden Befehl ein, um die Einstellungsdatei für die Lernumgebung "100 Knocks-Preprocess" von Git Hub auf Ihren lokalen PC zu übertragen.
Docker
$ git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess
-
Öffnen Sie die Oracle VM VirtualBox, klicken Sie mit der rechten Maustaste auf die "Standard" -VM und wählen Sie "Einstellungen".
-
[Wichtig! !! ] </ B> Wählen Sie "Freigegebener Ordner", klicken Sie auf das Symbol oben rechts, geben Sie den Pfad des Ordners an, den Sie zuvor von Github mitgebracht (geklont) haben, und geben Sie den Ordner frei. (Wenn Sie dies nicht tun, können Sie keine Dateien freigeben, die nicht in Docker enthalten sind, und Sie können keine ausreichende Umgebung erstellen !!)
- Starten Sie das Docker Quickstart Terminal erneut und führen Sie den folgenden Befehl aus. (Es dauert ein paar 10 Minuten, um die Einstellung abzuschließen)
Docker
$ cd 100knocks-preprocess
$ docker-compose up -d --build
- Greifen Sie nach Abschluss der Einstellungen mit einem Browser auf die folgende Adresse zu.
http://192.168.99.100:8888
Es ist in Ordnung, wenn der folgende Bildschirm angezeigt wird.
Zusammenfassung
Ich habe vorgestellt, wie man 100 Data Science-Schläge auf Windows bewegt.
Derzeit klopfe ich viel an 100 Datenwissenschaften. Ich werde in Kürze einen Artikel über diese Sammlung von Problemen veröffentlichen. Schauen Sie sich das also auch an.
Das Erstellen einer virtuellen Umgebung mit Docker mag zunächst schwierig sein, aber sobald Sie sich daran gewöhnt haben, können Sie mit GitHub wie diesmal eine Infrastruktur erstellen, sodass dies ein sehr praktisches Tool ist.