[PYTHON] Pandas Grundlagen für Anfänger ⑧ Ziffernverarbeitung

Was ist Pandas?

Eine Bibliothek zum Verarbeiten strukturierter Daten (Tabellentypdaten) in Python. Es handelt sich um eine Bibliothek, die problemlos das Lesen von Dateien und die anschließende Verarbeitung / Extraktionsverarbeitung durchführen kann (sie kann wie SQL ausgeführt werden) und für die Datenvorverarbeitung wie maschinelles Lernen unverzichtbar ist. Die Tabelle für andere Elemente ist hier.

Einführung

In diesem Artikel ist dies die Verarbeitungsmethode für die Anzahl der Ziffern. Das erste, was Sie verstehen müssen, ist, wie Sie die Anzahl der Stellen in Pandas selbst und die Anzahl der Stellen in einzelnen Datenrahmen und Variablen anpassen. Beachten Sie auch, dass Pandas-Rundungen keine Rundungen sind, sondern auf gerade Zahlen. Wenn Sie die Rundung nicht kennen, überprüfen Sie sie.

Vorbereitung

Importieren Sie zunächst die Bibliothek. Benennen Sie pandas pd und importieren Sie es.

python


import pandas as pd

Ich werde das Beispiel mit Titanic-Daten ausprobieren. Wenn Sie die Titanic nicht kennen, überprüfen Sie bitte "kaggle Titanic".

python


dataframe = pd.read_csv('train.csv')

Anpassen der Anzahl der Ziffern in Pandas

Verschiedene Einstellungen von Pandas werden mit "Option" verwaltet. (Es gibt verschiedene andere Optionen. Überprüfen Sie daher, ob Sie interessiert sind.) Die Gesamtzahl der Ziffern wird von display.float_format und die Anzahl der Ziffern nach dem Dezimalpunkt von display.precision verwaltet. Lassen Sie es uns tatsächlich überprüfen.

In


print(pd.options.display.float_format)
print(pd.options.display.precision)

Out


None
6

Die Gesamtzahl der Stellen ist unbegrenzt, und nach dem Dezimalpunkt werden 6 Stellen angezeigt. Wenn Sie beispielsweise die tatsächlichen Daten betrachten, wird der Tarif bis zu 4 Stellen nach dem Dezimalpunkt angezeigt. Dies wird folgendermaßen angezeigt, da die ursprünglichen CSV-Daten nur 4 Stellen haben. Wenn die Anzahl der Stellen jedoch groß ist, werden bis zu 6 Stellen angezeigt. image.png

Ändern Sie diesen Wert dann so, dass zwei Nachkommastellen angezeigt werden. (Die Tarifanzeige besteht aus 2 Ziffern.)

python


pd.options.display.precision = 2

image.png Verwenden Sie reset_option, wenn Sie initialisieren möchten.

python


pd.reset_option('display.precision')

So stellen Sie individuell ein

Verwenden Sie "round ()" für individuelle Einstellungen. Wenn Sie 2 Nachkommastellen verwenden möchten, ist dies wie folgt. (Die Tarifanzeige besteht aus 2 Ziffern.)

python


dataframe.round(2)

image.png

Wenn Sie es für jede Spalte festlegen möchten, sieht es wie folgt aus. (Beispiel: Alter ist 1 Ziffer und Tarif ist 3 Ziffern.)

python


dataframe.round({'Age':1, 'Fare':3})

image.png

Schließlich

Wie ein Anfänger verstehen kann, haben wir das notwendige Wissen bei der Implementierung von maschinellem Lernen mit Python als einfachen Artikel zusammengefasst. Das Inhaltsverzeichnis ist hier, daher hoffe ich, dass Sie auch auf andere Artikel verweisen können.

Recommended Posts

Pandas Grundlagen für Anfänger ⑧ Ziffernverarbeitung
Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten
Pandas Basics Summary Link für Anfänger
Pandas-Grundlagen für Anfänger ③ Erstellen Sie ein Histogramm mit matplotlib
Pandas-Grundlagen für Anfänger ② Übersicht über die Daten
Seaborn Basics für Anfänger ④ Pairplot
100 Pandas klopfen für Python-Anfänger
Seaborn Grundlagen für Anfänger ② Histogramm (Distplot)
Pandas Grundlagen
[Muss für Anfänger] Grundlagen von Linux
Pandas Grundlagen
Pandas-Grundlagen für Anfänger ④ Umgang mit Datums- und Zeitangaben
Verarbeiten von Memos, die häufig bei Pandas (Anfängern) verwendet werden
Python Pandas ist nicht für die Stapelverarbeitung geeignet
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
[Zur Aufnahme] Pandas Memorandum
[Übersetzung] NumPy Official Tutorial "NumPy: die absoluten Grundlagen für Anfänger"
Spacemacs-Einstellungen (für Anfänger)
Python-Grundlagen ② für Anweisung
Datensätze mit Pandas verarbeiten (1)
Datensätze mit Pandas verarbeiten (2)
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
MongoDB-Grundlagen: Transaktionsverarbeitung
Python Lehrbuch für Anfänger
100 Sprachverarbeitung Knock: Kapitel 2 UNIX-Befehlsgrundlagen (mit Pandas)
[Linux] Grundlagen der Berechtigungseinstellung von chmod für Anfänger
Dikstra-Algorithmus für Anfänger
OpenCV für Python-Anfänger
Seaborn-Grundlagen für Anfänger ③ Streudiagramm (Jointplot) * Mit Histogramm
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 2
[Erklärung für Anfänger] Einführung in die Faltverarbeitung (erklärt in TensorFlow)
[Erklärung für Anfänger] Einführung in die Pooling-Verarbeitung (erklärt in TensorFlow)
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 1
Lernablauf für Python-Anfänger
[Für Anfänger] Kaggle-Übung (Merucari)
Empfohlene Linux-Distribution für Anfänger
CNN (1) zur Bildklassifizierung (für Anfänger)
Python3-Umgebungskonstruktion (für Anfänger)
Übersicht über Docker (für Anfänger)
Python #Funktion 2 für Super-Anfänger
Grundlegende Python-Grammatik für Anfänger
Python #Funktion 1 für Super-Anfänger
Python #Liste für Super-Anfänger
~ Tipps für Python-Anfänger mit Liebe von Pythonista ③ ~
[Für Kaggle-Anfänger] Titanic (LightGBM)
Linux Command Memorandum [für Anfänger]
Datenverarbeitungstipps mit Pandas
Praktische Linux-Verknüpfung (für Anfänger)
[Python] Iterative Verarbeitung (für, während)
[Pandas] Ich habe versucht, Verkaufsdaten mit Python zu analysieren. [Für Anfänger]
Seaborn-Grundlagen für Anfänger ① Aggregiertes Diagramm der Anzahl der Daten (Countplot)