[PYTHON] À partir de la page du produit AWS cloud, placez le nom du service AWS sur csv

Lorsqu'on lui a demandé à quoi l'utiliser, il n'y a pas d'autre choix que de se taire


import requests
import re
import csv
from bs4 import BeautifulSoup

r = requests.get('https://aws.amazon.com/jp/products/')
data = BeautifulSoup(r.text,'html.parser')
tags = data.find_all("div",class_="lb-content-item")

regex = re.compile('<a href.*?>(?P<name>.*?)<span>(?P<content>.*?)</span>')

with open('a.csv','w',newline='',encoding='utf8') as f:
    writer = csv.writer(f)

    for t in map(lambda tag:str(tag),tags):
        m = regex.search(t)
        writer.writerow([m['name'],m['content']])

a.csv


 Amazon Athena,Requête de données dans S3 à l'aide de SQL
 Amazon CloudSearch,Service de recherche géré
...

Recommended Posts

À partir de la page du produit AWS cloud, placez le nom du service AWS sur csv
Extrayez le nom du produit et le prix de la liste de produits dans l'e-mail de déclaration d'achat de Yodobashi.com.
Obtenez le nom de fichier enregistré dans AWS S3 (1000 ou plus)
Formatez le journal Git et obtenez le nom du fichier validé au format csv
Mettez le module dans l'application Pepper
Le sexe est déterminé à partir du nom.
Obtenez le nom d'hôte en Python
Implémenté dans Dataflow pour copier la structure hiérarchique de Google Drive vers Google Cloud Storage