[PYTHON] Obtenez le nom de fichier enregistré dans AWS S3 (1000 ou plus)

Chose que tu veux faire

Je souhaite connaître tous les noms de fichiers enregistrés dans un certain dossier dans un certain compartiment d'AWS S3. À l'heure actuelle, il y a plus de 1000 fichiers sous un certain dossier dans un certain compartiment.

point important Étant donné que list_object ne peut obtenir que 1000 éléments, il est nécessaire de concevoir un processus pour obtenir des informations sur les fichiers.

Méthode

https://boto3.amazonaws.com/v1/documentation/api/latest/guide/paginators.html Comme décrit dans.

code

sample.py


import boto3

MY_REGION = 'Nom de la région';
MY_BUCKET = 'Nom du godet';

#Répertoire sous le seau
TARGET_PATH = 'tmp/YYYY/MM/DD/';

client = boto3.client('s3', region_name=MY_REGION)
paginator = client.get_paginator('list_objects')

#Paramètres de filtrage
operation_parameters = {
    'Bucket': MY_BUCKET,
    'Prefix': TARGET_PATH
}

page_iterator = paginator.paginate(**operation_parameters)

#Clé d'objet S3 de sortie
for page in page_iterator:
    for content in page['Contents']:
        print(content['Key'])

Exemple de sortie du code ci-dessus

tmp/YYYY/MM/DD/0001.txt
tmp/YYYY/MM/DD/0002.txt
tmp/YYYY/MM/DD/0003.txt
....
tmp/YYYY/MM/DD/1000.txt
tmp/YYYY/MM/DD/1001.txt
tmp/YYYY/MM/DD/1002.txt

memo ・ Je me souviens personnellement qu'il était difficile d'obtenir des informations sur plus de 1000 fichiers, mais récemment, j'ai été un peu impressionné par le fait que c'était facile à faire, j'ai donc écrit cet article. -Aussi, je ne savais pas que vous pouviez spécifier le filtrage comme sous un dossier spécifique, donc mémo mémo.

Recommended Posts

Obtenez le nom de fichier enregistré dans AWS S3 (1000 ou plus)
Obtenir le nom de fichier dans un dossier à l'aide de glob
Obtenez le nom d'hôte en Python
Formatez le journal Git et obtenez le nom du fichier validé au format csv
Je veux obtenir le nom du fichier, le numéro de ligne et le nom de la fonction dans Python 3.4
Comment obtenir le nom de la variable lui-même en python
Obtenez le type MIME en Python et déterminez le format de fichier
Récupère le nom de la classe où la méthode est définie dans le décorateur
Exporter la liste de clés incluse dans S3 Bucket dans un fichier
Recherchez le nom du fichier, y compris le mot et l'extension spécifiés dans le répertoire
Obtenez la formule dans le fichier Excel sous forme de chaîne en Python
À partir de la page du produit AWS cloud, placez le nom du service AWS sur csv
Enregistrez le fichier binaire en Python
Obtenez le chemin du bureau en Python
Obtenez le chemin du script en Python
L'histoire du "trou" dans le fichier
Obtenez le chemin du bureau en Python
Obtenez le chemin du fichier à l'aide de Pathlib
Récupérer la chaîne de requête (chaîne de requête) avec Django
Le nom du fichier était mauvais en Python et j'étais accro à l'importation
Obtenez l'adresse IP du client avec Django
Obtenez les nièmes valeurs les plus importantes dans Pandas
Utilisez boto pour télécharger le fichier depuis S3.
Prenez la somme logique de List en Python (fonction zip)
[Python] Récupère le nom de la variable avec str
Obtenez le chemin d'accès au fichier d'unité systemd
Lisez le fichier ligne par ligne avec Python
J'ai essayé de sauvegarder les données récupérées au format CSV!
Lisez le fichier ligne par ligne avec Python
Je ne peux pas obtenir l'élément dans Selenium!
[Python] Récupère le code de caractère du fichier
Obtenir la liste de codes EDINET en Python
[Python] Lire la ligne spécifiée dans le fichier
Comment obtenir le nom du bloc-notes que vous utilisez actuellement dans Google Colab
Python / subprocess> Implémentation de lien symbolique pour obtenir uniquement le nom du fichier de destination> os.readlink ()
Gérez CSV avec l'élément que vous souhaitez analyser dans le nom du fichier