Die Kraft der Pandas: Python

pandas.jpeg

Pandas Basics### Pandas is a Python package providing fast, flexible, and expressive data structures designed to make working with “relational” or “labeled” data both easy and intuitive. It aims to be the fundamental high-level building block for doing practical, real world data analysis in Python. Additionally, it has the broader goal of becoming the most powerful and flexible open source data analysis / manipulation tool available in any language. It is already well on its way toward this goal.

Pandas is a high-level data manipulation tool developed by Wes McKinney. It is built on the Numpy package and its key data structure is called the DataFrame. DataFrames allow you to store and manipulate tabular data in rows of observations and columns of variables.

pandas.png

pandas is well suited for many different kinds of data: -Tabellendaten mit heterogen typisierten Spalten, wie in einer SQL-Tabelle oder einer Excel-Tabelle -Bestellte und ungeordnete (nicht unbedingt festfrequente) Zeitreihendaten. ・ Beliebige Matrixdaten (homogen oder heterogen) mit Zeilen- und Spaltenbeschriftungen ・ Jede andere Form von Beobachtungs- / statistischen Datensätzen. Die Daten müssen tatsächlich überhaupt nicht gekennzeichnet werden, um in eine Pandas-Datenstruktur eingefügt zu werden

Here are just a few of the things that pandas does well: ・ Einfache Behandlung fehlender Daten (dargestellt als NaN) sowohl in Gleitkommadaten als auch in Nicht-Gleitkommadaten -Size-Mutabilität: Spalten können in DataFrame- und höherdimensionale Objekte eingefügt und daraus gelöscht werden -Automatische und explizite Datenausrichtung: Objekte können explizit an einer Reihe von Beschriftungen ausgerichtet werden, oder der Benutzer kann die Beschriftungen einfach ignorieren und Serien, DataFrame usw. die Daten bei Berechnungen automatisch für Sie ausrichten lassen ・ Leistungsstarke, flexible Gruppierung nach Funktionen zum Ausführen von Split-Apply-Combine-Vorgängen für Datensätze zum Aggregieren und Transformieren von Daten ・ Machen Sie es einfach, unregelmäßige, unterschiedlich indizierte Daten in anderen Python- und NumPy-Datenstrukturen in DataFrame-Objekte zu konvertieren ・ Intelligentes etikettenbasiertes Slicing, ausgefallene Indizierung und Teilmenge großer Datenmengen ・ Intuitives Zusammenführen und Zusammenfügen von Datensätzen ・ Flexibles Umformen und Schwenken von Datensätzen ・ Hierarchische Beschriftung von Achsen (mehrere Beschriftungen pro Tick möglich) ・ Robuste E / A-Tools zum Laden von Daten aus Einfachdateien (CSV und getrennt), Excel-Dateien, Datenbanken und zum Speichern / Laden von Daten aus dem ultraschnellen HDF5-Format -Zeitserienspezifische Funktionen: Generierung und Frequenzkonvertierung von Datumsbereichen, Statistiken zu beweglichen Fenstern, Datumsverschiebung und Verzögerung.

2020-09-25 18_49_13-pandas-data-structure.svg.png

To load the pandas package and start working with it, import the package.

In [1]: import pandas as pd

■Creating data The two primary data structures of pandas, Series (1-dimensional) and DataFrame (2-dimensional).Each column in a DataFrame is a Series.

** ・ DataFrame ** A DataFrame is a table. It contains an array of individual entries, each of which has a certain value. Each entry corresponds to a row (or record) and a column. For example, consider the following simple DataFrame:

In [2]: pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]})

Out [2]:

Yes No
0 50 131
1 21 2

2020-09-25 17_35_21-What kind of data does pandas handle_ — pandas 1.1.2 documentation.png

DataFrame entries are not limited to integers. For instance, here's a DataFrame whose values are strings:

In [3]: pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})

Out [3]:

Bob Sue
0 I liked it. Pretty good.
1 It was awful. Bland.

There are several ways to create a DataFrame. One way is to use a dictionary. For example: 2020-09-25 17_25_46-Pandas Basics - Learn Python - Free Interactive Python Tutorial.png

** · Serie ** A Series, by contrast, is a sequence of data values. If a DataFrame is a table, a Series is a list. And in fact you can create one with nothing more than a list:

create-series-in-python-pandas-0.png

In [4]: pd.Series([1, 2, 3, 4, 5])
Out [4]: 
0    1
1    2
2    3
3    4
4    5
dtype: int64

■Reading data files Another way to create a DataFrame is by importing a csv file using Pandas. Data can be stored in any of a number of different forms and formats. By far the most basic of these is the humble CSV file. Now, the csv cars.csv is stored and can be imported using pd.read_csv: 2020-09-25 17_26_56-Pandas Basics - Learn Python - Free Interactive Python Tutorial.png

or we can examine the contents of the resultant DataFrame using the head() command, which grabs the first five rows:

In [5]: pd.head()

■ Other Useful Tricks ** ・ Holen Sie sich das aktuelle Arbeitsverzeichnis **

In [6]: import os
In [7]: os.getcwd()

** ・ Überprüfen Sie, wie viele Zeilen und Spalten in den Daten vorhanden sind ** (o/p -> no. of rows, no. of columns)

In [8]: pd.shape
Out [8]: (2200, 15)

** ・ Benennen Sie die Spalten um **

In [9]: pd_new = pd.rename(colums = {'Amount.Requested': 'Amount.Requested_NEW'})  
In [10]: pd_new.head()

** ・ Schreiben Sie einen Datenrahmen in CSV oder Excel **

df.to_csv("filename.csv", index = False)
df.to_excel("filename.xlsx", index = False)

There are two ways to handle the situation where we do not want the index to be stored in csv file.

  1. you can use index=False while saving your dataframe to csv file.
df.to_csv("file_name.csv", index=False)

2 . Or you can save your dataframe as it is with an index, and while reading you just drop the column unnamed 0 containing your previous index.

df.to_csv("file_name.csv")
df_new = pd.read_csv("file_name.csv").drop(['unnamed 0'],axis=1)

here is the cheat-sheet for pandas. https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

Enjoy the Power of Pandas and I hope you found it helpful. Thank you for spending the time to read this article. See you in next topic. :grinning: :grinning:

Recommended Posts

Die Kraft der Pandas: Python
der Zen von Python
Pandas des Anfängers, vom Anfänger, für den Anfänger [Python]
Auf dem Weg zum Ruhestand von Python2
Über die Funktionen von Python
Die Geschichte von Python und die Geschichte von NaN
[Python] Operationsnotiz von Pandas DataFrame
[Python] Der Stolperstein des Imports
Erster Python 3 ~ Der Beginn der Wiederholung ~
Existenz aus Sicht von Python
pyenv-change die Python-Version von virtualenv
Die Leistungsfähigkeit von Kombinationsoptimierungslösern
[Python] Die potenzielle Feldplanung von Python Robotics verstehen
Lernen Sie die Grundlagen von Python ① Grundlegende Anfänger
[Python] Zusammenfassung der Verwendung von Pandas
Ändern Sie die Länge der Python-CSV-Zeichenfolgen
Überprüfen Sie das Verhalten des Zerstörers in Python
Meine Pandas (Python)
[Python3] Verstehe die Grundlagen von Beautiful Soup
Notizen vom Anfang von Python 1 lernen
Überprüfen Sie die Existenz der Datei mit Python
Informationen zur virtuellen Umgebung von Python Version 3.7
[Python3] Schreiben Sie das Codeobjekt der Funktion neu
Ich kannte die Grundlagen von Python nicht
Python-Grundlagen ①
Das Ergebnis der Installation von Python auf Anaconda
Grundlagen von Python ①
Überprüfen Sie den Pfad des importierten Python-Moduls
Die Geschichte der Manipulation globaler Python-Variablen
Kopie von Python
[Python] [Meta] Ist der Python-Typ ein Typ?
Die Python-Projektvorlage, an die ich denke.
Auf der Suche nach dem schnellsten FizzBuzz in Python
Python-Grundkurs (Ende 15)
Legen Sie den Prozessnamen des Python-Programms fest
[Python] Ruft den Zeichencode der Datei ab
Die Geschichte der Verarbeitung A von Blackjack (Python)
Lernen Sie intuitiv die Umformung von Python np
Python Hinweis: Die geheime Rolle von Kamma
Notizen vom Anfang von Python 2 lernen
Python Pandas Memo
Einführung von Python
Japanische Übersetzung: PEP 20 - Das Zen von Python
[Python3] Grundlegendes zu Dateivorgängen
Holen Sie sich den Inhalt von Git Diff aus Python
Geben Sie die Anzahl der CPU-Kerne in Python aus
Ich habe die Pivot-Table-Funktion von Pandas ausprobiert
Test von emacs-org parser orgparse für Python
[Python] Checklistenelemente alle, alle
[Python] Sortieren Sie die Liste von pathlib.Path in natürlicher Reihenfolge
Bereiten Sie die Ausführungsumgebung von Python3 mit Docker vor
Automatischer Betrieb von Chrome mit Python + Selen + Pandas
Zusammenfassung der Unterschiede zwischen PHP und Python
Der Inhalt des Python-Tutorials (Kapitel 5) ist in einem Aufzählungszeichen zusammengefasst.
Der Inhalt des Python-Tutorials (Kapitel 4) ist in einem Aufzählungszeichen zusammengefasst.
Der Inhalt des Python-Tutorials (Kapitel 2) ist in einem Aufzählungszeichen zusammengefasst.