[PYTHON] J'ai essayé de visualiser les données BigQuery à l'aide de Jupyter Lab avec GCP

Mise en garde

Je suis nouveau sur GCP, python et jupyter. J'étais très content de pouvoir le déplacer en circulant, alors je l'ai posté. Je vous serais reconnaissant si vous pouviez me faire savoir si vous avez des erreurs.

référence

Créer des données BigQuery

Ouvrez la console GCP

https://console.cloud.google.com/

Sélectionnez "Big Query" dans le menu latéral

Screen Shot 2020-08-23 at 18.27.52.png

Cliquez sur "Créer un ensemble de données"

Screen Shot 2020-08-23 at 18.32.48.png

J'ai essayé de le créer avec l'ID de l'ensemble de données défini sur "test_data_set"

Screen Shot 2020-08-23 at 18.33.46.png

Créez facilement des tableaux et des données pour les tests

Collez la requête suivante dans l'éditeur de requête et cliquez sur Exécuter

create table test_data_set.t (i INT64);
insert into test_data_set.t values (1),(2),(5),(7),(12);

Screen Shot 2020-08-23 at 18.45.00.png

Maintenant que nous avons les données, examinons-les en utilisant Jupyter.

Screen Shot 2020-08-23 at 18.45.59.png

Instanciation de notebook

Sélectionnez Menu latéral> "AI Platform"> "Notebook"

Screen Shot 2020-08-23 at 17.36.45.png

"Nouvelle instance"> "Python 2 et 3" a été sélectionné

Screen Shot 2020-08-23 at 17.53.28.png

Vous pouvez sélectionner la région, etc. et le montant estimé est également affiché, mais cette fois, je supprimerai l'instance dès que je l'essayerai, j'ai donc appuyé sur "Créer" avec les paramètres par défaut

Screen Shot 2020-08-23 at 18.03.53.png

Cliquez sur "Ouvrir JUPYTER LAB"

Screen Shot 2020-08-23 at 18.10.47.png

Ouverture du Jupyter Lab

Screen Shot 2020-08-23 at 19.14.42.png


Quand j'ai essayé pour la première fois d'obtenir des données BigQuery

"UserWarning: Cannot create BigQuery Storage client, the dependency google-cloud-bigquery-storage is not installed."

J'ai eu une erreur, alors installez d'abord google-cloud-bigquery-storage.

Cliquez sur "Console"

Screen Shot 2020-08-23 at 19.12.40.png

Installez google-cloud-bigquery-storage

$ pip install google-cloud-bigquery-storage

Screen Shot 2020-08-23 at 19.09.06.png


Appuyez sur Python 3 pour créer un nouveau bloc-notes

Screen Shot 2020-08-23 at 18.55.47.png

Par défaut, JupyterLab a un fichier appelé / tutorials / bigquery / BigQuery basics.ipynb, et il y avait une explication facile à comprendre, j'ai donc essayé de créer facilement un processus d'acquisition de données à partir de bigquery en me référant à cette zone.

from google.cloud import bigquery

client = bigquery.Client(location="US")

query = """
    select *
    from test_data_set.t
    order by i
"""

query_job = client.query(
    query,
    # Location must match that of the dataset(s) referenced in the query.
    location="US",
)  # API request - starts the query

dv = query_job.to_dataframe()
print(df)
df.plot()

Appuyez sur "▷" pour exécuter

Screen Shot 2020-08-23 at 19.33.57.png

J'ai pu afficher les données de la grande requête que j'ai faite en premier sous forme de graphique!


Il y aura une charge à la fin, alors arrêtez avec "Stop"

Screen Shot 2020-08-23 at 19.41.54.png


Merci d'avoir regardé jusqu'à la fin m (_ _) m

Recommended Posts

J'ai essayé de visualiser les données BigQuery à l'aide de Jupyter Lab avec GCP
J'ai essayé d'utiliser Jupyter
[Pythonocc] J'ai essayé d'utiliser la CAO sur un notebook Jupyter
J'ai essayé d'utiliser BigQuery ML
J'ai essayé d'utiliser PySpark de Jupyter 4.x sur EMR
jupyter je l'ai touché
J'ai essayé de rechercher des vidéos à l'aide de l'API de données Youtube (débutant)
J'ai essayé d'utiliser "Syncthing" pour synchroniser des fichiers sur plusieurs PC
[TF] J'ai essayé de visualiser le résultat de l'apprentissage en utilisant Tensorboard
J'ai essayé d'analyser les données scRNA-seq en utilisant l'analyse des données topologiques (TDA)
J'ai essayé d'obtenir rapidement des données d'AS / 400 en utilisant pypyodbc
J'ai essayé AdaNet pour les données de table
J'ai essayé d'utiliser le notebook jupyter d'une manière ou d'une autre
J'ai essayé de numériser le tampon estampé sur papier en utilisant OpenCV
[Python] J'ai essayé d'obtenir diverses informations en utilisant l'API de données YouTube!
J'ai essayé d'obtenir rapidement des données d'AS / 400 en utilisant pypyodbc Préparation 1
J'ai essayé de visualiser AutoEncoder avec TensorFlow
J'ai essayé d'utiliser l'API de données YOUTUBE V3
J'ai essayé de classer le texte en utilisant TensorFlow
J'ai essayé d'utiliser l'API BigQuery Storage
[Python] J'ai essayé de visualiser la nuit du chemin de fer de la galaxie avec WordCloud!
J'ai essayé d'utiliser jpholidayp sur proxy pour exécuter cron uniquement en semaine
Je souhaite afficher une image sur Jupyter Notebook à l'aide d'OpenCV (mac)
J'ai essayé d'effectuer une analyse de cluster de clients à l'aide des données d'achat
J'ai essayé d'utiliser l'API à distance avec GAE / J
J'ai essayé de sauvegarder les données avec discorde
J'ai essayé de synthétiser des fichiers WAV en utilisant Pydub.
Je veux visualiser les fichiers csv en utilisant Vega-Lite!
J'ai essayé d'obtenir des données CloudWatch avec Python
J'ai essayé de lancer jupyter nteract sur le serveur heroku
J'ai essayé de démarrer Jupyter avec toutes les lumières d'Amazon
J'ai essayé DBM avec Pylearn 2 en utilisant des données artificielles
J'ai créé un jeu ○ ✕ avec TensorFlow
J'ai essayé de créer un BOT de traduction qui fonctionne avec Discord en utilisant googletrans
J'ai essayé de récupérer les données de l'ordinateur portable en le démarrant sur Ubuntu
J'ai essayé de faire MAP rapidement une personne suspecte en utilisant les données d'adresse Geolonia
Une bibliothèque pour la science des données "Je veux faire ça" sur le bloc-notes Jupyter
J'ai essayé d'utiliser paramétré
J'ai essayé d'utiliser argparse
J'ai essayé d'utiliser la mimesis
J'ai essayé d'utiliser anytree
J'ai essayé d'implémenter Mine Sweeper sur un terminal avec python
J'ai essayé d'utiliser Summpy
J'ai essayé de prédire le match de la J League (analyse des données)
Python pratique 100 coups J'ai essayé de visualiser l'arbre de décision du chapitre 5 en utilisant graphviz
J'ai essayé d'utiliser coturn
J'ai essayé d'utiliser Pipenv
J'ai essayé d'utiliser matplotlib
J'ai essayé d'utiliser "Anvil".
J'ai essayé d'utiliser Hubot
J'ai essayé d'utiliser ESPCN
J'ai essayé d'utiliser openpyxl
J'ai essayé de regrouper les données ECG en utilisant la méthode K-Shape
J'ai essayé d'utiliser Ipython
J'ai essayé de déboguer.
J'ai essayé d'obtenir une AMI en utilisant AWS Lambda
J'ai essayé d'approcher la fonction sin en utilisant le chainer
J'ai essayé d'utiliser PyCaret
J'ai essayé d'utiliser cron
J'ai essayé de devenir un Ann Man en utilisant OpenCV