Dieser Artikel ist der erste Tag des Adventskalenders Cloud Analytics.
Wir beschäftigen uns mit Analyse, maschinellem Lernen, KI usw. mit dem Thema Analytics on the Cloud. Bereiten Sie diesmal beim Starten des Kalenders zuerst die Analyseumgebung vor. Das Folgende ist 30 Tage lang kostenlos erhältlich. Bitte berühren Sie es gemäß dem Kalender. Probieren Sie es auch aus, wenn Sie gerade ein Data Scientist-Team gründen.
Heute werde ich einen Überblick über die zu verwendende Umgebung geben und das erste Notizbuch erstellen.
Data Science Experience DataScienceExperience ist eine von IBM bereitgestellte Data Science-Plattform in der Cloud. Die für die Durchführung von Data Science erforderlichen Tools, einschließlich des Jupyter-Notizbuchs Ein vollständiger Satz ist verfügbar und dient zur Förderung von Data Science im Unternehmen Eine Plattform mit Teamentwicklungsfunktionen.
In DataScienceExperience
Jupyter Notebook und R Studio sind derzeit verfügbar.
Unten ist das Jupyter-Notizbuch.
Unten ist RStudio.
Die Benutzeroberfläche entspricht der von Notebook und RStudio, die Sie normalerweise verwenden.
DataSrouce Wie Sie die Daten erhalten, ist wichtig, wenn Sie DataScience starten. DataScienceExperience wird mit 5 GB Objektspeicher kostenlos geliefert. Darüber hinaus kann es mit jedem GUI-Speicher über eine grafische Benutzeroberfläche verbunden werden, insbesondere mit Cloudant (CouchDB) und Es hat eine gute Konnektivität mit DashDB. Unten sehen Sie den Bildschirm zum Erstellen von Verbindungen.
Andere Verbindungsinformationen wie S3 und Impara sind erforderlich, können jedoch als Datenquelle verwendet werden.
Erstellen Sie in DataScienceExperience ein Projekt und ein Notizbuch. Teilen Sie Ihr Notebook ganz einfach, indem Sie Ihrem Projekt weitere Benutzer hinzufügen Sie können die DataSource freigeben.
Das Folgende ist der Bearbeitungsbildschirm von Collaborator.
Sie können Admin, Viewer, Editor usw. einstellen.
Notizbücher und Datenquellen können auch für die gemeinsame Bearbeitung freigegeben werden.
Erstellen Sie zunächst ein Projekt.
Im Bild unten wurden bereits einige Projekte erstellt. Hier erstellen wir ein neues Projekt. Klicken Sie oben rechts auf die Schaltfläche Projekt erstellen, um zum Projekterstellungsbildschirm zu springen.
Das Bild unten zeigt den Projekterstellungsbildschirm.
Informationen zu den Feldern Spark Service und Object Storage Wählen Sie hier Spark Service und Object Storage aus, zu dem Project eine Verbindung herstellen kann. Sie müssen Spark Service jedoch nur zum ersten Mal erstellen. Für die Objektspeicherung können Sie diejenige auswählen, die beim Erstellen mit Spark Service geliefert wird, oder die Objektspeicherung d auf Bluemix.
Sie haben jetzt ein brandneues Projekt erstellt!
Als nächstes erstellen wir ein Notizbuch und führen den Code aus. Über die Schaltfläche Notizbücher hinzufügen auf dem zuvor erstellten Projektbildschirm Wechselt zum Bildschirm zum Erstellen von Notizbüchern.
Die Spark-Version kann zwischen 2.0 und 1.6 ausgewählt werden. Hier werden Python 2 und Spark 1.6 ausgewählt.
Über den Namen des Notebooks Derzeit scheint es einen Fehler zu geben, dass die Vorschau nicht gut ausgeführt werden kann, wenn das Element Name auf Japanisch eingegeben wird. Da ich das Problem angesprochen habe, denke ich, dass es behoben wird, aber lassen Sie uns hier alphabetische Zeichen eingeben.
Sie haben jetzt ein brandneues Notizbuch!
Versuchen wir, den Python-Code auszuführen!
hallo = "Hallo Data Scientist!"
print(hallo)
Fügen Sie den obigen Code in die erstellte Notebook-Zelle ein und klicken Sie auf die Schaltfläche Ausführen Der Code wird ausgeführt und das Ergebnis ausgegeben.
Sie können Zellen ausführen, indem Sie Umschalt + Eingabetaste drücken.
Jetzt sind Sie bereit für Data Science! !! !! Danach werden wir uns mit der Analyseverarbeitung unter Verwendung von Notebook, Objektspeicher und anderen DataSources befassen.
Recommended Posts