Eine Bibliothek zum Verarbeiten strukturierter Daten (Tabellentypdaten) in Python. Es handelt sich um eine Bibliothek, die problemlos das Lesen von Dateien und die anschließende Verarbeitung / Extraktionsverarbeitung durchführen kann (sie kann wie SQL ausgeführt werden) und für die Datenvorverarbeitung wie maschinelles Lernen unverzichtbar ist. Die Tabelle für andere Elemente ist hier.
In diesem Artikel ist dies die Verarbeitungsmethode für die Anzahl der Ziffern. Das erste, was Sie verstehen müssen, ist, wie Sie die Anzahl der Stellen in Pandas selbst und die Anzahl der Stellen in einzelnen Datenrahmen und Variablen anpassen. Beachten Sie auch, dass Pandas-Rundungen keine Rundungen sind, sondern auf gerade Zahlen. Wenn Sie die Rundung nicht kennen, überprüfen Sie sie.
Importieren Sie zunächst die Bibliothek. Benennen Sie pandas pd und importieren Sie es.
python
import pandas as pd
Ich werde das Beispiel mit Titanic-Daten ausprobieren. Wenn Sie die Titanic nicht kennen, überprüfen Sie bitte "kaggle Titanic".
python
dataframe = pd.read_csv('train.csv')
Verschiedene Einstellungen von Pandas werden mit "Option" verwaltet. (Es gibt verschiedene andere Optionen. Überprüfen Sie daher, ob Sie interessiert sind.) Die Gesamtzahl der Ziffern wird von display.float_format
und die Anzahl der Ziffern nach dem Dezimalpunkt von display.precision
verwaltet.
Lassen Sie es uns tatsächlich überprüfen.
In
print(pd.options.display.float_format)
print(pd.options.display.precision)
Out
None
6
Die Gesamtzahl der Stellen ist unbegrenzt, und nach dem Dezimalpunkt werden 6 Stellen angezeigt. Wenn Sie beispielsweise die tatsächlichen Daten betrachten, wird der Tarif bis zu 4 Stellen nach dem Dezimalpunkt angezeigt. Dies wird folgendermaßen angezeigt, da die ursprünglichen CSV-Daten nur 4 Stellen haben. Wenn die Anzahl der Stellen jedoch groß ist, werden bis zu 6 Stellen angezeigt.
Ändern Sie diesen Wert dann so, dass zwei Nachkommastellen angezeigt werden. (Die Tarifanzeige besteht aus 2 Ziffern.)
python
pd.options.display.precision = 2
Verwenden Sie reset_option
, wenn Sie initialisieren möchten.
python
pd.reset_option('display.precision')
Verwenden Sie "round ()" für individuelle Einstellungen. Wenn Sie 2 Nachkommastellen verwenden möchten, ist dies wie folgt. (Die Tarifanzeige besteht aus 2 Ziffern.)
python
dataframe.round(2)
Wenn Sie es für jede Spalte festlegen möchten, sieht es wie folgt aus. (Beispiel: Alter ist 1 Ziffer und Tarif ist 3 Ziffern.)
python
dataframe.round({'Age':1, 'Fare':3})
Wie ein Anfänger verstehen kann, haben wir das notwendige Wissen bei der Implementierung von maschinellem Lernen mit Python als einfachen Artikel zusammengefasst. Das Inhaltsverzeichnis ist hier, daher hoffe ich, dass Sie auch auf andere Artikel verweisen können.
Recommended Posts