Wenn das Erlernen von Python Pandas-bezogene Inhalte enthält, werde ich diese von Zeit zu Zeit aktualisieren.
Pandas Eine Bibliothek, die Funktionen zur Unterstützung der Datenanalyse bietet
python
import pandas as pd
python
csv_test_1 = pd.read_csv('hoge.csv')
python
excel_data = pd.read_excel('hoge.xlsx')
python
csv_test_2 = pd.read_csv('hoge_2.csv')
csv_test = pd.concat([csv_test_1 , csv_test_2], ignore_index=True)
csv_test.head()
-Wenn die Elementnamen beider zu verbindenden Tabellen identisch sind. Kombinieren Sie mit `on =" id "`
als Bedingung.
Post-Join-Tabelle= pd.merge(Tabelle 1,Tabelle 2, on="Element verbinden", how="Methode")
#### **`python`**
```python
join_data = pd.merge(a_data, b_data[["id", "date", "customer"]], on="id", how="left")
join_data.head()
-Wenn die Elementnamen beider zu verbindenden Tabellen unterschiedlich sind. Kombiniert mit `left_on =" customer_name ", right_on =" customer name ""
`.
python
pd.merge(a_data, b_data, left_on="customer_name", right_on="Kundenname", how="left")
python
pd.unique(test_data.item_name))
len(pd.unique(test_data.item_name))) #Anzahl eindeutiger Daten
python
test_data["a"] = pd.to_datetime(test_data["a"])
python
time_data["payment_month"] = time_data["payment_date"].dt.strftime("%Y%m")
python
pd.pivot_table(test_data, index='item_name', columns='payment_month', values=['price', 'quantity'], aggfunc='sum')
** ・ Pivot_table Übersicht ** index: Geben Sie eine Zeile an Spalten: Geben Sie Spalten an Werte: Geben Sie die zu aggregierenden Werte an aggfunc: Geben Sie die Aggregationsmethode an
python
print(len(test_data)) #Zeigen Sie die Anzahl der Daten an
python
csv_test_1.head()
python
csv_test_1["Spaltenname"].head()
python
res = test_data.loc[flg_is_null, "item_name"]
python
test_data["new"] = test_data["a"] * test_data["b"]
python
test_data["a"].sum()
python
test_data.groupby("create_date").sum()["price"]
python
test_data.groupby(["create_date", "item_name"]).sum()[["price", "quantity"]]
python
test_data["a"].sum() == test_data["b"].sum()
python
test_data.isnull().sum()
python
test_data.isnull().any(axis=0)
python
test_data.describe()
python
test_data["create_date"].min()
test_data["create_date"].max()
python
test_data.dtypes
-Die folgenden verschiedenen Statistiken können mit description () angezeigt werden. Anzahl der Daten (Anzahl), Mittelwert (Mittelwert), Standardabweichung (Standard), Minimum (min), Quadrant (25%, 75%), Median (50%), Maximum (max)
Arbeitsnotiz · Datenbereinigung
Datenverarbeitung: Pandas Visualisierung: Matplotlib Maschinelles Lernen: Scikit-Lernen
Recommended Posts