Datenverarbeitungsnotiz von Pandas Die Informationsseite über Pandas ist ziemlich umfangreich, daher handelt es sich hauptsächlich um eine Zusammenfassung der Links.
Ich denke, es ist besser, Jupyter (IPython) Notebook als Ausführungsumgebung zu verwenden.
Installieren Sie Python3 und Jupyter Notebook (ehemals Ipython Notebook) unter Windows - Qiita
$ pip install pandas
import pandas as pd
Sie können einen DataFrame mit pd.DataFrame
erstellen. Beachten Sie, dass die Anzahl der Daten für jede Spalte übereinstimmen muss.
Erstellen eines DataFrame
df = pd.DataFrame({
'A' : [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 10],
'B' : [1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8]
})
Daten lesen und DataFrame erstellen
# CSV
csv_data = pd.read_csv('./path/to/hoge.csv')
# TSV
tsv_data = pd.read_csv('./path/to/hoge.csv', delimiter='\t')
Lesen und Schreiben von CSV / TsV-Dateien mit pandas | mwSoft Lesen Sie csv / tsv mit nicht konstanter Spaltengröße mit Pandas: mwSoft-Blog Python Coding Memorandum-Part 3- (Mastering pandas read_csv) - Reise zur Selbstbetrachtung
Python Pandas Datenauswahlprozess etwas detaillierter <Teil 1> --StatsFragments Python Pandas Datenauswahlprozess etwas detaillierter <Teil 2> --StatsFragments Python Pandas Datenauswahlprozess etwas detaillierter <Teil 2> --StatsFragments Siehe Datenrahmen nach Bedingung in Pandas - Qiita
data = data[['column1', 'column2']]
data = data[data.column1 == 'hoge']
data = data[data.column1.str.contains(regex)]
Python-Pandas: Suche nach DataFrame mit regulären Ausdrücken --Qiita <Python, Pandas> Datenrahmen-Zeichenfolgensuche - Nekoyukis Memo
Entfernen Sie Zeilen mit einem der fehlenden Werte
df = df.dropna()
Element angeben
df = df.dropna(subset=['Gegenstand 1', 'Punkt 2'])
Python-Pandas-Diagramm Datenverkettung / Join-Verarbeitung --StatsFragments Merge, join, and concatenate — pandas 0.18.1 documentation
Daten sortieren
#Bei einem Typ
df = df.sort_values(['Datentyp'])
# 1 ->Sortieren Sie in aufsteigender Reihenfolge von 2
df = df.sort_values(['Datentyp 1', 'Datentyp 2'])
pandas.DataFrame.sort_values — pandas 0.18.1 documentation Nach Pandas-Qiita sortieren
df.rename(columns={'A': 'a'}, index={'ONE': 'one'}, inplace=True)
pandas.DataFrame.rename — pandas 0.18.1 documentation Ändern des Zeilennamens / Spaltennamens von Pandas DataFrame | nkmk-Protokoll
df = df.reset_index(drop=True)
python - How to reset index in a pandas data frame? - Stack Overflow pandas.DataFrame.reset_index — pandas 0.18.1 documentation
Als Gleitkommatyp behandeln
df = df.astype(float)
Inversion der Matrix
df = df.T
df.values.tolist()
python - Pandas DataFrame to list - Stack Overflow
# CSV
data.to_csv('./path/to/output.csv')
# TSV
data.to_csv('./path/to/output.csv', sep='\t')
Lesen und Schreiben von CSV / TsV-Dateien mit pandas | mwSoft
Microsoft Access (mdb) [Linux] [Python] [Pandas] Microsoft Access-Datenbank (* .mdb) mit Pandas lesen - Qiita
Pandas wickeln matplotlib
dünn ein. Bis zu einem bestimmten Diagramm kann mit "Plot" von Pandas ausgegeben werden.
Die Grundlagen zur Ausgabe von Diagrammen in Pandas finden Sie im Folgenden.
Visualization — pandas 0.18.1 documentation
Beherrschen der Python-Pandas-Plotfunktion-StatsFragments Wenn Sie die Plot-Funktion von Pandas in Python verwenden, ist sie von der Datenverarbeitung bis zur Diagrammerstellung sehr nahtlos - Qiita
Python pandas Missing / Outlier / Discrete Handling-StatsFragments
Drei TIPPS zur Aufrechterhaltung der Leistung von Python-Pandas - StatsFragments
Kommentarbuch des Autors von Pandas O'Reilly Japan - Einführung in die Datenanalyse mit Python
Recommended Posts