[PYTHON] Daten in RDS mit AWS Glue überschreiben

Beim Schreiben von Daten in RDS mit DynamicFrame in einem Klebejob Da es durch Anhängen geschrieben wird, werden Daten dupliziert, wenn derselbe Job ausgeführt wird.

Durch Konvertieren eines DynamicFrame in einen DataFrame können Sie im Überschreibmodus schreiben.

Fügen Sie dem Code des automatisch generierten Jobs Folgendes hinzu. Es wird davon ausgegangen, dass die JDBC-Verbindungsdefinition vorbereitet ist.

#datasink4 = glueContext.write_dynamic_frame.from_jdbc_conf(frame = dropnullfields3, catalog_connection = "MyConnection", connection_options = {"dbtable": "my_table", "database": "my_database"}, transformation_ctx = "datasink4")

#Abrufen von JDBC-Informationen aus der Verbindungsdefinition
jdbc_conf = glueContext.extract_jdbc_conf(connection_name='MyConnection')

#Dynamischen Frame in Datenframe konvertieren
df = dropnullfields3.toDF()

#Schreiben Sie DataFrame in die Tabelle (Überschreibmodus)
df.write \
    .format("jdbc") \
    .option("url", jdbc_conf['url']) \
    .option("dbtable", "my_database.my_table") \
    .option("user", jdbc_conf['user']) \
    .option("password", jdbc_conf['password']) \
    .mode("overwrite") \
    .save()

job.commit()

In diesem Beispiel habe ich S3-Daten in Aurora Serverless MySQL geschrieben, konnte sie jedoch überschreiben.

Recommended Posts

Daten in RDS mit AWS Glue überschreiben
Verwalten Sie Ihre Daten mit AWS RDS
Holen Sie sich mit Python zusätzliche Daten zu LDAP
Versuchen Sie, mit Binärdaten in Python zu arbeiten
RDS-Daten über die Schrittplattform werden an Pandas gesendet
Behandeln Sie 3D-Datenstrukturen mit Pandas
Visualisieren Sie Korona-Infektionsdaten in Tokio mit matplotlib
Löschen Sie Daten in einem Muster mit Redis Cluster
Lesen Sie Tabellendaten in einer PDF-Datei mit Python
Glue Studio [AWS]
Melden Sie sich einfach mit mehreren Konten bei AWS an
Erste Schritte mit AWS IoT in Python
Trainieren Sie MNIST-Daten mit PyTorch mithilfe eines neuronalen Netzwerks
Holen Sie sich Amazon RDS (PostgreSQL) -Daten mithilfe von SQL mit Pandas
Erstellen Sie Amazon Linux mit AWS EC2 und melden Sie sich an
Sortieren Sie die Postdaten in umgekehrter Reihenfolge mit Djangos ListView
Erstellen Sie AWS EC2 und RDS mit Terraform Terraform 3 Minuten Garzeit
Löschen Sie DynamoDB-Daten nach 5 Minuten mit den AWS-Schrittfunktionen
Datenanalyse mit Python 2
Abtastung in unausgeglichenen Daten
[blackbird-rds] Überwachung von AWS RDS
Daten mit TensorFlow lesen
Datenvisualisierung mit Pandas
Datenmanipulation mit Pandas!
Datenerweiterung mit openCV
Daten mit Scipy normieren
Datenanalyse mit Python
LADEN SIE DATEN mit PyMysql
Versuchen Sie, COVID-19 Tokyo-Daten mit Python zu kratzen
Einfallsreichtum beim speichersparenden Umgang mit Daten mit Pandas
[AWS] Umgang mit dem Fehler "Ungültiger Codepunkt" in CloudSearch
Versuchen Sie, Daten zu erfassen, während Sie mit anaconda eine Portweiterleitung an RDS durchführen.
Einführung in Flask Part 2: Anzeigen von Datenrahmen in Stylesheets