Cet article s'adresse à tous ceux qui souhaitent interroger Athena et analyser les résultats avec des pandas. Je pense que c'est particulièrement utile lors de l'analyse avec un notebook Jupyter.
Installez PyAthena.
pip install PyAthena
Utilisez la fonction de connexion. Spécifiez la clé AWS et le chemin de S3 qui crache le résultat de l'interrogation avec Athena. Si vous l'exécutez à l'aide de la fonction pd.read_sql, vous pouvez obtenir le résultat de l'exécution sous la forme de pandas.
from pyathena import connect
import pandas as pd
aws_access_key_id = 'Your aws access key id'
aws_secret_access_key = 'Your aws secret access key'
conn = connect(aws_access_key_id=aws_access_key_id,
aws_secret_access_key=aws_secret_access_key,
s3_staging_dir='Your s3 path',
region_name='ap-northeast-1')
df = pd.read_sql("SELECT * FROM sample", conn)
Recommended Posts