Dieser Artikel richtet sich an alle, die Athena abfragen und die Ergebnisse mit Pandas analysieren möchten. Ich denke, es ist besonders nützlich, wenn Sie mit einem Jupyter-Notebook analysieren.
Installieren Sie PyAthena.
pip install PyAthena
Verwenden Sie die Verbindungsfunktion. Geben Sie den AWS-Schlüssel und den Pfad von S3 an, der das Ergebnis der Abfrage mit Athena ausspuckt. Wenn Sie es mit der Funktion pd.read_sql ausführen, können Sie das Ausführungsergebnis in Form von Pandas erhalten.
from pyathena import connect
import pandas as pd
aws_access_key_id = 'Your aws access key id'
aws_secret_access_key = 'Your aws secret access key'
conn = connect(aws_access_key_id=aws_access_key_id,
aws_secret_access_key=aws_secret_access_key,
s3_staging_dir='Your s3 path',
region_name='ap-northeast-1')
df = pd.read_sql("SELECT * FROM sample", conn)
Recommended Posts