[PYTHON] Starten Sie Data Science in der Cloud

Dieser Artikel ist der erste Tag des Adventskalenders Cloud Analytics.

Wir beschäftigen uns mit Analyse, maschinellem Lernen, KI usw. mit dem Thema Analytics on the Cloud. Bereiten Sie diesmal beim Starten des Kalenders zuerst die Analyseumgebung vor. Das Folgende ist 30 Tage lang kostenlos erhältlich. Bitte berühren Sie es gemäß dem Kalender. Probieren Sie es auch aus, wenn Sie gerade ein Data Scientist-Team gründen.

Heute werde ich einen Überblick über die zu verwendende Umgebung geben und das erste Notizbuch erstellen.

Data Science Experience DataScienceExperience ist eine von IBM bereitgestellte Data Science-Plattform in der Cloud. Die für die Durchführung von Data Science erforderlichen Tools, einschließlich des Jupyter-Notizbuchs Ein vollständiger Satz ist verfügbar und dient zur Förderung von Data Science im Unternehmen Eine Plattform mit Teamentwicklungsfunktionen.

Ausführungsumgebung

In DataScienceExperience

Schnittstelle

Jupyter Notebook und R Studio sind derzeit verfügbar.

Unten ist das Jupyter-Notizbuch. スクリーンショット 2016-12-05 10.08.22.png

Unten ist RStudio. スクリーンショット 2016-12-05 10.10.00.png

Die Benutzeroberfläche entspricht der von Notebook und RStudio, die Sie normalerweise verwenden.

DataSrouce Wie Sie die Daten erhalten, ist wichtig, wenn Sie DataScience starten. DataScienceExperience wird mit 5 GB Objektspeicher kostenlos geliefert. Darüber hinaus kann es mit jedem GUI-Speicher über eine grafische Benutzeroberfläche verbunden werden, insbesondere mit Cloudant (CouchDB) und Es hat eine gute Konnektivität mit DashDB. Unten sehen Sie den Bildschirm zum Erstellen von Verbindungen. スクリーンショット 2016-12-05 10.20.22.png

Andere Verbindungsinformationen wie S3 und Impara sind erforderlich, können jedoch als Datenquelle verwendet werden. スクリーンショット 2016-12-05 10.20.38.png

Teamentwicklung

Erstellen Sie in DataScienceExperience ein Projekt und ein Notizbuch. Teilen Sie Ihr Notebook ganz einfach, indem Sie Ihrem Projekt weitere Benutzer hinzufügen Sie können die DataSource freigeben.

Das Folgende ist der Bearbeitungsbildschirm von Collaborator. スクリーンショット 2016-12-05 10.23.49.png

Sie können Admin, Viewer, Editor usw. einstellen.

Notizbücher und Datenquellen können auch für die gemeinsame Bearbeitung freigegeben werden. スクリーンショット 2016-12-05 10.26.12.png

Ein Projekt erstellen

Erstellen Sie zunächst ein Projekt.

Im Bild unten wurden bereits einige Projekte erstellt. Hier erstellen wir ein neues Projekt. Klicken Sie oben rechts auf die Schaltfläche Projekt erstellen, um zum Projekterstellungsbildschirm zu springen. スクリーンショット 2016-12-05 10.32.41.png

Das Bild unten zeigt den Projekterstellungsbildschirm. スクリーンショット 2016-12-05 10.37.49.png

Informationen zu den Feldern Spark Service und Object Storage Wählen Sie hier Spark Service und Object Storage aus, zu dem Project eine Verbindung herstellen kann. Sie müssen Spark Service jedoch nur zum ersten Mal erstellen. Für die Objektspeicherung können Sie diejenige auswählen, die beim Erstellen mit Spark Service geliefert wird, oder die Objektspeicherung d auf Bluemix.

Sie haben jetzt ein brandneues Projekt erstellt! スクリーンショット 2016-12-05 10.42.06.png

Erstellen Sie ein Notizbuch und führen Sie einfachen Code aus

Als nächstes erstellen wir ein Notizbuch und führen den Code aus. Über die Schaltfläche Notizbücher hinzufügen auf dem zuvor erstellten Projektbildschirm Wechselt zum Bildschirm zum Erstellen von Notizbüchern.

スクリーンショット 2016-12-05 10.51.04.png

Die Spark-Version kann zwischen 2.0 und 1.6 ausgewählt werden. Hier werden Python 2 und Spark 1.6 ausgewählt.

Über den Namen des Notebooks Derzeit scheint es einen Fehler zu geben, dass die Vorschau nicht gut ausgeführt werden kann, wenn das Element Name auf Japanisch eingegeben wird. Da ich das Problem angesprochen habe, denke ich, dass es behoben wird, aber lassen Sie uns hier alphabetische Zeichen eingeben.

Sie haben jetzt ein brandneues Notizbuch! スクリーンショット 2016-12-05 10.54.54.png

Versuchen wir, den Python-Code auszuführen!

hallo = "Hallo Data Scientist!"
print(hallo)

Fügen Sie den obigen Code in die erstellte Notebook-Zelle ein und klicken Sie auf die Schaltfläche Ausführen Der Code wird ausgeführt und das Ergebnis ausgegeben.

スクリーンショット 2016-12-05 10.57.39.png

Sie können Zellen ausführen, indem Sie Umschalt + Eingabetaste drücken.

Jetzt sind Sie bereit für Data Science! !! !! Danach werden wir uns mit der Analyseverarbeitung unter Verwendung von Notebook, Objektspeicher und anderen DataSources befassen.

Recommended Posts

Starten Sie Data Science in der Cloud
Versuchen Sie "100 Schläge auf Data Science" ①
Wie die Abteilung Informationssysteme (Anfänger) mit der Datenwissenschaft beginnen kann
Löschen Sie die Daten auf der Festplatte vollständig
Bücher über Datenwissenschaft, die 2020 gelesen werden sollen
Lernen Sie Data Science
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 018 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 023 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 030 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 022 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 017 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 026 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 016 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 024 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 027 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 029 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 015 Erläuterung
[Python] 100 Schläge auf Data Science (strukturierte Datenverarbeitung) 028 Erläuterung
Führen Sie die Kolben-App auf Cloud 9 und Apache Httpd aus
Bereinigen Sie das Cloud-Paket für den Datenbereitstellungsbereich
Senden Sie Protokolldaten vom Server an Splunk Cloud
Fordern Sie 100 Data Science-Schläge heraus
Installieren Sie django auf Python + Anaconda und starten Sie den Server
OPT Data Science Wettbewerb
Versuchen Sie, das Python Data Science-Handbuch ins Japanische zu übersetzen
Anzeigen von Wettervorhersagen auf M5Stack + Google Cloud Platform
Versuchen Sie, mit Oracle Cloud Infrastructure Data Science auf AWS Redshift-Daten zuzugreifen
Dockerfile zum Erstellen einer datenwissenschaftlichen Umgebung basierend auf pip3
Datenanalyse basierend auf den Wahlergebnissen der Gouverneurswahl von Tokio (2020)
Bis zum Start des Django-Tutorials mit Pycharm unter Windows
Data Science 100 Klopfkommentar (P021 ~ 040)
Data Science 100 Klopfkommentar (P061 ~ 080)
Data Science 100 Klopfkommentar (P041 ~ 060)
Gzip komprimiert Daten durch Streaming
Data Science 100 Klopfkommentar (P081 ~ 100)
Installieren Sie JDK unter Linux
Data Science Cheet Sheet (Python)
[Python] Hinweise zur Datenanalyse
Infra_Data Science Course Output
Sehen Sie sich das Video auf Fedora31 an
Fügen Sie den Link unter Linux ein
So starten Sie die erste Projektion
[Alter Artikel] Data Science Experience (DSX) ist jetzt im Lite-Plan (viel kostenlos) in der IBM Cloud verfügbar, daher habe ich ihn berührt. ★ 2017/11 Update
Organisieren Sie nützliche Blogs im Bereich Data Science (Übersee & Japan).
Ich habe mit Kaggle Start Book basierend auf Kaggle studiert [Teil 1]
Ich habe das Bild der Science University auf Twitter mit Word2Vec überprüft.
So aktualisieren Sie die Python-Version von Cloud Shell in GCP
[AWS / Tello] Aufbau eines Systems zum Betrieb von Drohnen in der Cloud
[Django] Registrierungsdaten für Benutzer im Registrierungs- / Bearbeitungsformular (Formular) anzeigen