[PYTHON] Verwenden Sie BigQuery von Ihrem lokalen Jupyter Notebook

Einführung

Oft möchten Sie BigQuery-Daten aus Ihrem lokalen Jupyter-Notizbuch für weniger ressourcenintensive Analysen verwenden. Daher werde ich eine Methode zum Schreiben einer BigQuery-Abfrage in ein lokales Jupyter-Notizbuch und zum Speichern in einem DataFrame vorstellen. ・ MacOS Mojave ・ Python 3.7.3

Erstellen Sie eine virtuelle Umgebung für Python 3

Erstellen Sie ein geeignetes Verzeichnis (hier / Users / {Benutzername} / BigQueryLocal), erstellen Sie eine virtuelle Umgebung namens EVN3 mit virtualenv und aktivieren Sie ENV3.

$ mkdir BigQueryLocal
$ cd BigQueryLocal
$ virtualenv -p python3.7 ENV3
$ source ENV3/bin/activate

gcloud-Authentifizierung

Klicken Sie zunächst auf die folgende URL. https://cloud.google.com/docs/authentication/getting-started?hl=ja

Wenn Sie auf die obige URL klicken, wird der folgende Bildschirm angezeigt. Klicken Sie auf "Gehe zur Seite [Dienstkontoschlüssel erstellen]". スクリーンショット 2019-11-19 20.45.05.png

Gehen Sie zu "Dienstkontoschlüssel erstellen", setzen Sie das Dienstkonto auf "App Engine-Standarddienstkonto", setzen Sie den Schlüsseltyp auf "JSON" und klicken Sie auf "Erstellen", um die JSON-Datei herunterzuladen.

スクリーンショット 2019-11-19 20.42.12.png

Platzieren Sie den heruntergeladenen JSON-Kontoschlüssel {xxxxxxxxxx} .json direkt unter / Users / {Benutzername} / BigQueryLocal und führen Sie Folgendes aus.

$ export GOOGLE_APPLICATION_CREDENTIALS="/Users/{username}/BigQueryLocal/{xxxxxxxxxx}.json"

Erstellen Sie ein Projektverzeichnis

Es ist nicht immer notwendig, aber für eine bessere Sichtbarkeit erstellen und verschieben Sie ein Verzeichnis namens "TestProject".

$ mkdir TestProject
$ cd TestProject

Installieren Sie die erforderlichen Pakete

Installieren Sie die folgenden mindestens erforderlichen Pakete mit pip.

$ pip install google-cloud-bigquery
$ pip install jupyter
$ pip install pandas

Starten Sie Jupyter Notebook

Starten Sie das Jupiter-Notizbuch mit dem folgenden Befehl.

$ jupyter notebook

Erstellen Sie nach dem Start ein geeignetes Notizbuch, importieren Sie die folgenden Module und authentifizieren Sie den Client.

[1]
from google.cloud import bigquery
client = bigquery.Client()

Hier werden die standardmäßig vorbereiteten Daten von "bigquery-public-data.samples.natality" verwendet. Durch Ausführen der folgenden Schritte können BigQuery-Daten von DataFrame verarbeitet werden.

[2]
sql = """
SELECT
    plurality,
    COUNT(1) AS count,
    year
FROM
    `bigquery-public-data.samples.natality`
WHERE
    NOT IS_NAN(plurality) AND plurality > 1
GROUP BY
    plurality, year
ORDER BY
    count DESC
"""
df = client.query(sql).to_dataframe()
df.head()

Tatsächlich ist die Ausgabe wie folgt und es kann bestätigt werden, dass sie als DataFrame ausgegeben wird. jupyter_sample.png

Ab dem nächsten Mal müssen Sie nur noch Folgendes tun:

$ cd BigQueryLocal
$ source ENV3/bin/activate
$ export GOOGLE_APPLICATION_CREDENTIALS="/Users/{username}/BigQueryLocal/{xxxxxxxxxx}.json"
$ cd TestProject
$ jupyter notebook

Referenz

Weiter unten finden Sie Informationen zum Erstellen von Umgebungen mit virtualenv. https://cloud.google.com/python/setup?hl=ja

Im Folgenden erfahren Sie, wie Sie BigQuery mit Jupyter Notebook verwenden. https://cloud.google.com/bigquery/docs/visualize-jupyter?hl=ja

Recommended Posts

Verwenden Sie BigQuery von Ihrem lokalen Jupyter Notebook
Verwenden Sie BigQuery aus Python.
Verwenden Sie das Jupyter-Notebook, indem Sie eine Verbindung von einem anderen Host herstellen
Verwenden Sie pip mit Jupyter Notebook
Verwenden Sie Cython mit Jupyter Notebook
So verwenden Sie Jupyter Notebook
Markdown mit Jupyter-Notebook verwenden (mit Verknüpfung)
Einfach zu bedienendes Jupyter-Notebook (Python3.5)
So verwenden Sie das Jupyter-Notebook, ohne Ihre Umgebung mit Docker zu verschmutzen
Verwenden Sie nbextensions mit Anacondas Jupyter-Notizbuch
Verwenden von Apache Spark mit Jupyter Notebook (IPython Notebook)
Verwenden Sie Jupyter Lab und Jupyter Notebook mit EC2
Verwendung des Jupyter-Notebooks mit ABCI
Jupyter Notebook Grundlagen der Verwendung
Verwenden Sie vim-Tastenkombinationen in Jupyter Notebook, das mit Docker gestartet wurde
Verwenden Sie Django aus einem lokalen Python-Skript
Verwendung des Jupyter-Notebooks [super basic]
Jupyter Notizbuch Memo
Einführung in Jupyter Notebook
Leistungsstarkes Jupyter-Notizbuch
Verwenden Sie Python in Ihrer Umgebung von Win Automation
Jupyter Notebook Passwort
Jupyter Notizbuch Memo
Jupyter Notebook-Einstellungen - Verwendung (EC2 Amazon Linux 2)
Probieren Sie Apache Spark mit Jupyter Notebook (auf Local Docker) aus
Führen Sie Tensorflow von Jupyter Notebook unter Bash unter Ubuntu unter Windows aus
Importieren Sie bestimmte Zellen aus anderen Notizbüchern mit Jupyter-Notizbuch
So starten Sie Jupyter Notebook sofort vom Terminal aus
Verwenden Sie Django-Funktionen aus Batch-Skripten außerhalb des Django-Projekts
Machen Sie Jupyter Notebook zu Ihrem eigenen: Ändern Sie Hintergrund und Symbole
Verwenden Sie thingspeak aus Python
Starten Sie Jupyter Notebook
Verwenden Sie fließend Python
3 Jupyter Notebook (Python) Tricks
Verwenden Sie MySQL aus Python
Führen Sie BigQuery von Lambda aus
Verwenden Sie nim mit Jupyter
[Cloud103] # 3 Jupyter Notebook wieder
Verwenden Sie mecab-ipadic-neologd von Python
Geben Sie das Kostenlimit an, wenn Sie BigQuery beiläufig von Jupyter abfragen
Ich möchte eine virtuelle Umgebung mit Jupyter Notebook verwenden!