[PYTHON] Laden Sie Daten mit einem Befehl und einer Aktualisierung auf s3 von aws hoch und löschen Sie die verwendeten Daten (unterwegs).

Installieren von AWS CLI Version 1

Installieren der neuesten Version der AWS CLI pip3 install awscli --upgrade --user

Es scheint, dass es installiert wurde, aber aws --version Dann zsh: command not found: aws Wird rauskommen ... Fügen Sie die Ausführungsdatei für AWS CLI Version 1 zum Befehlszeilenpfad von macOS hinzu (https://docs.aws.amazon.com/ja_jp/cli/latest/userguide/install-macos.html#awscli-install-osx- Pfad) Basierend auf dem obigen Artikel "Fügen Sie das aws-Programm zur Umgebungsvariablen PATH des Betriebssystems hinzu". → Aber doch zsh: command not found: aws Wird rauskommen ...?

which python Es erscheint als "/ Users / user name / anaconda3 / bin / python".

AWS CLI installieren Nach dem obigen Artikel Wenn Sie --user während der ersten Installation verwenden, wird es in .local installiert. Ich muss meinen PFAD in ~ / .local / bin einfügen, aber jetzt

export PATH =" / Users / username / anaconda3 / bin: $ PATH " Ich frage mich, ob es daran liegt, dass es ...

Ist die Methode bei der Verwendung von Anakonda anders? how to install AWSCLI on a Anaconda python distribution aws codecommit aws: command not found

→ Fazit

conda install -c conda-forge awscli Nach dem Ausführen konnte ich AWS-Befehle hervorragend verwenden.

AWS CLI-Einstellungen

Referenzseite aws configureAWS Access Key ID [None]: 〜〜 AWS Secret Access Key [None]: 〜〜 Default region name [None]: ap-northeast-1 Default output format [None]: json

AWS CLI-Befehlsliste Bestätigen Sie, dass Sie den Inhalt von s3 mit aws s3 ls sehen können

Kopieren Sie die Datei lokal auf s3.

aws s3 cp s3: // {Bucket Name} / {Pfad} {lokaler Pfad}

Sie können den Pfad der Datei auf s3 kopieren, indem Sie auf "Klicken Sie auf Datei-> Klicken Sie auf Pfad kopieren" klicken. (Folgendes ist beim Herunterladen in den Download-Ordner) aws s3 cp s3: // ~ ~ ~ / Benutzer / Benutzername / Downloads

Entpacken Sie die Datei mit Python und entfernen Sie die zusätzlichen Spalten

Referenz: Sie können komprimierte Dateien auch mit pandas.read_csv lesen. Sehr angenehm!

python


import pandas as pd
df = pd.read_csv('Dateiname.csv.gz')

#Nicht verwendete Spalten löschen
df=df.drop(columns=['A','B','C'],axis=1)

#Löschen Sie die Zeile, wenn in Spalte a ein Wert fehlt
df=df.dropna(subset=['a'])

df.to_csv('./renamed_file/Dateiname nach der Komprimierung.csv.gz', index=False, compression='gzip')

Führen Sie den Befehl von Python aus.

[Einführung in Python] Lassen Sie uns Befehle mit einem Unterprozess ausführen!

Schauen Sie sich als Test den Inhalt von s3 aus Python an

python


import subprocess

subprocess.call(["aws","s3","ls"])

→ Erfolg

Laden Sie von S3 in den Ordner download / point_data herunter, dekomprimieren Sie ihn, fügen Sie die Verarbeitung hinzu, komprimieren Sie ihn erneut in den Ordner download / renamed_file, platzieren Sie ihn und laden Sie ihn an den angegebenen Speicherort in S3 hoch.

python


import subprocess
path_list=[Liste der PATH-Dateien in S3, die Sie herunterladen möchten]
for s in range(len(path_list)):
    cmd="aws s3 cp"+" "+path_list[s]+" "+"/Users/Nutzername/Downloads/point_data"
    subprocess.call(cmd.split())
    df = pd.read_csv(filename_list[s])
    #Nicht verwendete Spalten löschen
    df=df.drop(columns=df.columns[[1,2,3,4,5]], axis=1)#Zahlen sind Spaltennummern Links ist ein Beispiel
    
    #Zeile ohne Spaltennamen A löschen
    df=df.dropna(subset=['A'])
    #sparen
    file_name='/Users/Nutzername/Downloads/renamed_file/'+Dateiname
    df.to_csv(file_name, index=False, compression='gzip')
    cmd2="aws s3 cp"+" "+"/Users/Nutzername/Downloads/renamed_file/"+Dateiname+" "+ 'Pfad des Standorts auf S3, den Sie hochladen möchten'
    subprocess.call(cmd2.split())
    

Recommended Posts

Laden Sie Daten mit einem Befehl und einer Aktualisierung auf s3 von aws hoch und löschen Sie die verwendeten Daten (unterwegs).
Verarbeiten Sie die mit Redshift entladene gzip-Datei mit Python of Lambda, gzipen Sie sie erneut und laden Sie sie in S3 hoch
[AWS lambda] Stellen Sie mit lambda verschiedene Bibliotheken bereit (generieren Sie eine Zip-Datei mit einem Kennwort und laden Sie sie auf s3 hoch) @ Python
Verwenden Sie den Befehl [shell], um eine beliebige Datei zu komprimieren, um eine Datei zu erstellen und die Originaldatei zu löschen.
GAE - Drehen Sie mit Python das Bild basierend auf den Rotationsinformationen von EXIF und laden Sie es in den Cloud-Speicher hoch.
Erstellen Sie mit Streamlit schnell ein Python-Datenanalyse-Dashboard und stellen Sie es in AWS bereit
POST das ausgewählte Bild auf der Website mit mehrteiligen / Formulardaten und speichere es in Amazon S3! !!
Geben Sie die Bilddaten mit Flask of Python zurück und zeichnen Sie sie in das Canvas-Element von HTML
Ein Befehl zum einfachen Überprüfen der Netzwerkgeschwindigkeit auf der Konsole
[Persönliches Memo] Holen Sie sich Daten im Web und machen Sie daraus einen DataFrame
Konvertieren Sie eine Tabelle in CSV und laden Sie sie mit Cloud-Funktionen in den Cloud-Speicher hoch
Verwenden Sie AWS Lambda, um Nachrichten zu kratzen und LINE regelmäßig über Updates zu informieren [Python]
Lesen Sie die Daten des NFC-Lesegeräts, das mit Python an Raspberry Pi 3 angeschlossen ist, und senden Sie sie mit OSC an openFrameworks
Machen Sie ein Thermometer mit Raspberry Pi und machen Sie es im Browser Teil 3 sichtbar
Die Niederschlagsdaten der Meteorologischen Agentur kratzen und auf M5Stack anzeigen
Einführung in Python mit Atom (unterwegs)
Ich habe versucht, die Daten des Laptops durch Booten unter Ubuntu zu retten
Ich wollte die Anzahl der Zeilen in mehreren Dateien wissen und versuchte, sie mit einem Befehl abzurufen
[AWS S3] Bestätigung des Vorhandenseins von Ordnern in S3
[Einführung in Python] So erhalten Sie den Datenindex mit der for-Anweisung
[Python3] Machen Sie einen Screenshot einer Webseite auf dem Server und schneiden Sie sie weiter zu
Ich habe versucht, das Update von "Werde ein Romanautor" mit "IFTTT" und "Werde ein Romanautor API" zu benachrichtigen.
Versuchen Sie, mit matplotlib aus den Daten von "Schedule-kun" eine Kampfaufzeichnungstabelle zu erstellen.
Es war ein Leben, das ich auf AWS Lambda OCR wollte, um die Charaktere zu lokalisieren.
Von der Einführung von Flask unter CentOS bis zum Service unter Nginx und uWSGI
Eine Geschichte über den Versuch, mit der kostenlosen Stufe von AWS zur COVID-19-Analyse beizutragen, und das Scheitern
Mit der Docker-Version der Nginx-Einheit war es ein wenig schwierig, eine Flasche zu machen
Versuchen Sie zu normalisieren Schneiden Sie das Bild mit einem Scikit-Bild aus (obwohl es unterwegs wütend wird)
Ein Memo darüber, wie man das schwierige Problem der Erfassung von FX mit AI überwinden kann
Ich wollte nur die Daten des gewünschten Datums und der gewünschten Uhrzeit mit Django extrahieren
Lesen Sie die CSV-Datei mit dem Jupiter-Notizbuch und schreiben Sie die Grafik übereinander
Übergang zum Update-Bildschirm mit dem Django-Tag
Ich mag es nicht, mit der Veröffentlichung von Pokemon Go frustriert zu sein, deshalb habe ich ein Skript erstellt, um die Veröffentlichung zu erkennen und zu twittern
Bei matplotlib ist die vertikale Achse auf der linken Seite des Histogramms die Frequenz und die vertikale Achse auf der rechten Seite die relative Frequenz (möglicherweise ein böser Weg).
Rufen Sie die Excel-Liste rekursiv in einem bestimmten Ordner mit Python ab und schreiben Sie sie in Excel.
Ich analysierte die Rangkampfdaten des Pokemon-Schwertschilds und visualisierte sie auf Tableau
So erhalten Sie die aktuellen Wetterdaten und zeigen sie auf der GUI an, während Sie sie automatisch aktualisieren
Geben Sie dem Befehl history ein Datum und eine Uhrzeit ein und sammeln Sie Verlaufsdateien aller Benutzer mit einem Skript
Eine einfache Möglichkeit, die in Python benötigte Zeit anzuzeigen und sie intelligenter zu verbessern
Wie man einen bestimmten Prozess am Anfang und Ende der Spinne mit Scrapy einfügt
[Ubuntu] So löschen Sie den gesamten Inhalt des Verzeichnisses
Mit den Daten von COVID-19 wurde ein Netzwerkdiagramm erstellt.
Holen Sie sich UNIXTIME zu Beginn des heutigen Tages mit einem Befehl
Lassen Sie uns den Befehl pünktlich mit dem Bot der Zwietracht ausführen
Wahrscheinlich der einfachste Weg, um mit Python 3 ein PDF zu erstellen
Erstellen Sie eine Python-Umgebung und übertragen Sie Daten auf den Server
Löschen Sie alle auf pip installierten Bibliotheken mit einem einzigen Befehl
Die Geschichte des Kopierens von Daten von S3 auf Googles TeamDrive
Die übliche Art, einen Kernel mit Jupyter Notebook hinzuzufügen
Eine Sammlung von Methoden, die beim Aggregieren von Daten mit Pandas verwendet werden
Laden Sie Dateien mit Django-Speicher in Google Cloud Storages hoch und löschen Sie sie
Versuchen Sie, Merkmale von Sensordaten mit CNN zu extrahieren
Ein Programm, das den Servobefehl der Funksteuerung empfängt, den Raspetorte unterbricht und protokolliert.
Ich habe versucht, eine Site zu erstellen, mit der die aktualisierten Informationen von Azure einfach angezeigt werden können
Eine Geschichte über das Schreiben von AWS Lambda und ein wenig Abhängigkeit von den Standardwerten von Python-Argumenten
[Für IT-Anfänger] Was tun, wenn der Befehl rev nicht mit Git Bash verwendet werden kann?
Ich habe versucht, den Sesam für Eingang 2 mit einem einzigen Druck auf die AWS IoT-Taste zu entsperren
[Python] Was ist Pip? Erläutern Sie die Befehlsliste und deren Verwendung anhand aktueller Beispiele