[PYTHON] Für Pandas-Benutzer ist es einfach, SQL zu üben

Hintergrund

Pandas ist eher daran gewöhnt, bei der Arbeit auf SQL zu stoßen ⇨ Ich möchte eine Umgebung, in der ich leicht üben kann (lokal, Python) ⇨pandasql

Bemerkungen

Installationspaket

pip install pandasql

Codebeispiel

Fügen Sie einfach den Variablennamen des Datenrahmens in den Tabellennamen ein und schreiben Sie SQL Sie können SQL für Datenrahmen ausgeben, die Sie immer mit Pandas berühren

import pandas as pd
from pandasql import sqldf, load_meat, load_births


# get data
df_meat = load_meat()
#df_births = load_births()


# check data (if you want)
if False: # just check
    df_meat.shape
    df_meat.head(2).T
    df_meat.dtypes
    df_meat.duplicated().sum()
    df_meat.isnull().sum()
    df_meat.nunique()
    desc = df_meat.describe().T
    desc[['min','25%','50%','75%','max']]
    desc[['mean','std']]


# sql scripts 1
sql = '''
    SELECT
        *
    FROM  
        df_meat
    LIMIT 
        10;
'''
# execute sql 1
res = sqldf(sql, locals())
res


# sql scripts 2
sql = '''
    SELECT
        other_chicken,
        avg(beef) as avg_beef
    FROM  
        df_meat
    GROUP BY
        other_chicken 
    ORDER BY
        avg_beef DESC
    LIMIT
        10
    ;
'''
# execute sql 2
res = sqldf(sql, locals())
res

Referenzlink

pypi

Recommended Posts

Für Pandas-Benutzer ist es einfach, SQL zu üben
Konvertieren Sie 202003 bis 2020-03 mit Pandas
Eine Bibliothek "Apywrapper", die auf einfache Weise einen Wrapper für die RESTful-API entwickelt
Konvertieren Sie mit Python für .NET von Pandas DataFrame in System.Data.DataTable
Leicht verständliche [Pandas] -Praxis / Datenbestätigungsmethode für Abiturienten