Mise en garde
Je suis nouveau sur GCP, python et jupyter. J'étais très content de pouvoir le déplacer en circulant, alors je l'ai posté. Je vous serais reconnaissant si vous pouviez me faire savoir si vous avez des erreurs.
Ouvrez la console GCP
https://console.cloud.google.com/
Sélectionnez "Big Query" dans le menu latéral
Cliquez sur "Créer un ensemble de données"
J'ai essayé de le créer avec l'ID de l'ensemble de données défini sur "test_data_set"
Créez facilement des tableaux et des données pour les tests
Collez la requête suivante dans l'éditeur de requête et cliquez sur Exécuter
create table test_data_set.t (i INT64);
insert into test_data_set.t values (1),(2),(5),(7),(12);
Maintenant que nous avons les données, examinons-les en utilisant Jupyter.
Sélectionnez Menu latéral> "AI Platform"> "Notebook"
"Nouvelle instance"> "Python 2 et 3" a été sélectionné
Vous pouvez sélectionner la région, etc. et le montant estimé est également affiché, mais cette fois, je supprimerai l'instance dès que je l'essayerai, j'ai donc appuyé sur "Créer" avec les paramètres par défaut
Cliquez sur "Ouvrir JUPYTER LAB"
Ouverture du Jupyter Lab
Quand j'ai essayé pour la première fois d'obtenir des données BigQuery
"UserWarning: Cannot create BigQuery Storage client, the dependency google-cloud-bigquery-storage is not installed."
J'ai eu une erreur, alors installez d'abord google-cloud-bigquery-storage
.
Cliquez sur "Console"
Installez google-cloud-bigquery-storage
$ pip install google-cloud-bigquery-storage
Appuyez sur Python 3 pour créer un nouveau bloc-notes
Par défaut, JupyterLab a un fichier appelé / tutorials / bigquery / BigQuery basics.ipynb
, et il y avait une explication facile à comprendre, j'ai donc essayé de créer facilement un processus d'acquisition de données à partir de bigquery en me référant à cette zone.
from google.cloud import bigquery
client = bigquery.Client(location="US")
query = """
select *
from test_data_set.t
order by i
"""
query_job = client.query(
query,
# Location must match that of the dataset(s) referenced in the query.
location="US",
) # API request - starts the query
dv = query_job.to_dataframe()
print(df)
df.plot()
Appuyez sur "▷" pour exécuter
J'ai pu afficher les données de la grande requête que j'ai faite en premier sous forme de graphique!
Il y aura une charge à la fin, alors arrêtez avec "Stop"
Merci d'avoir regardé jusqu'à la fin m (_ _) m
Recommended Posts