Die Analysesoftware von IBM, die Data Science Experience-Desktopversion DSX Desktop (Beta), wurde aktualisiert, daher habe ich sie installiert. (Ich habe es gleich nach dem Start der Beta versucht, aber es ist ein paar Monate her) Das Download-Volumen beträgt etwas mehr als 9 GB und das Volumen ist etwas groß, aber es kann davon ausgegangen werden, dass es von Anfang an als Docker-Image bereitgestellt wird: mild_smile:
Hier herunterladen https://datascience.ibm.com/desktop Ich habe die Mac-Version installiert
Wenn Sie den heruntergeladenen ausführen, wird dieser Bildschirm angezeigt
Wenn Sie DSX Desktop in den Ordner im Fenster ziehen und dort ablegen, wird im Anwendungsordner "IBM DSX Desktop" erstellt. Führen Sie ihn daher aus.
(Ich habe vergessen, einen Screenshot zu machen.) Installieren von Notebook und R Studio Sie werden aufgefordert, Optionen auszuwählen, z. B. ob Sie beide installieren oder Spark mit Notebook verwenden möchten. Die Download-Menge betrug ungefähr 6 GB ohne Spark, stieg um ungefähr 3 GB mit Spark auf 9 GB und mit R Studio auf ungefähr 11 GB. Es scheint, dass der R Studio-Teil später zusätzlich installiert werden kann, also habe ich ihn hinzugefügt, weil es bis Spark eine große Sache war.
Als ich den Installationsprozess fortsetzte, wurde ein langer Download gestartet. Es waren ungefähr 9 GB, aber ich glaube, es hat ungefähr 5 Stunden gedauert, um es in meiner LAN-Umgebung zu Hause auszuführen. Ich habe einmal auf dem Weg versagt und es erneut versucht. Der Grund für den Fehler war, dass der Download unterwegs Moos war. Zum Zeitpunkt des erneuten Versuchs wird der Bildschirmschoner des Mac ebenfalls vorübergehend ausgeschaltet und ernsthaft ausgeführt. Nach Abschluss des Downloads wird Extract etwa 5 Minuten lang ausgeführt, um die Installation abzuschließen. (Von der Installationsarbeit bin ich nur süchtig nach diesem Download. Der Rest ist reibungslos.)
Als ich es lief, war die Bewegung sehr leicht und beeindruckt: grinsen: Es ist möglicherweise nicht so gut wie das in SaaS in der Cloud angebotene DSX. Wenn Sie es starten, klicken Sie oben links auf das Symbol "≡", um den Bildschirm zum Erstellen eines Notizbuchs anzuzeigen.
(Dies ist ein Screenshot, der nach dem Erstellen verschiedener Dinge aufgenommen wurde. Der Bildschirm zum Erstellen von Notizbüchern sieht jedoch folgendermaßen aus. Klicken Sie auf Notizbuch hinzufügen, um ihn zu erstellen.)
Natürlich funktioniert auch das mit Jupyter erstellte Notebook. (Wie später beschrieben wird, befindet sich die Verzeichnisstruktur jedoch nicht auf dem Mac, sondern im Docker-Container, sodass dieser Bereich nicht so funktioniert, wie er ist.)
Als ich versuchte, es sofort nach der Installation probeweise auszuführen, gab read_excel von pandas einen Ausführungsfehler aus. Die Ursache war, dass xlrd nicht enthalten war. Ich habe es mit! Pip intall im Notebook hinzugefügt und es kann normal und normal ausgeführt werden.
Im Gegensatz zur Cloud-Version scheint DSX zumindest in der Beta auf Dateiformate beschränkt zu sein. Drücken Sie die Schaltfläche Datensatz hinzufügen oder das Symbol oben rechts (eine Schaltfläche, die wie eine "Einheitsmatrix von n = 2" mit einer Kombination aus 1 und 0 aussieht), um sich zu registrieren. Beim Importieren wird die lokale Datei in Docker importiert.
Es scheint unter / opt / notebooks / Assets gespeichert zu sein. (Im obigen Screenshot habe ich das Standardausführungsverzeichnis zur Laufzeit und den Assets-Ordner mit den registrierten Dateien angezeigt.)
Es funktioniert mit Docker und ich kenne das Verzeichnis, also habe ich es vom Mac-Terminal über die Befehlszeile registriert. Die list.txt im obigen Screenshot wird über die Befehlszeile registriert.
Wenn Sie es überprüfen, heißt es anaconda_with_spark. (Die zweite und die folgenden wurden diesmal möglicherweise nicht installiert.)
Wenn Sie die Shell in dem Container ausführen, in dem DSX Desktop ausgeführt wird, können Sie sehen, was los ist. (Shell mit Docker Exec ausführen) Ich weiß nicht, ob es in Ordnung ist, es anzupassen, aber es ist möglicherweise in Ordnung, ein Container-Image zu erstellen, das Sie für Ihre lokale Umgebung festgelegt haben.
Recommended Posts