[PYTHON] Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen

Wenn Sie möchten, dass Python es liest, möchte ich, dass das Zeichenformat utf-8 ist. Da es auf der Datenausgabeseite verschiedene Gründe gibt, muss die empfangende Seite in vielen Fällen konvertieren und lesen.

Die CSV-Ausgabe in der Windows- und Excel-Umgebung ist Shift-JIS. .. .. Also, mit Pandas,

import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="shift_jis")

Wenn Sie dies tun, können Sie es möglicherweise nicht richtig lesen, wenn Sie nicht vorsichtig sind, weil Sie denken, dass es in Ordnung ist.

`test.csv`


Yamada,1000
Sato,2000
Yamamoto,3000

Ich kann das lesen,

`test2.csv`


1,Yamada,1000
2,Takahashi,2000
3,Schwarz 﨑,3000

Ich erhalte ausnahmslos den folgenden Fehler. .. ..

UnicodeDecodeError: 'shift_jis' codec can't decode byte 0xfb in position 0: illegal multibyte sequence

Dies ist in test2.csv, ・ Hashigodaka "** Taka " ・ Tachisaki " Saki **" Dies liegt daran, dass die Zeichenfolge der Windows-Erweiterung gemischt ist. Um solche Zeichen lesen zu können, muss der Zeichencode cp932 sein.

encoding='cp932'

Aus diesem Grund ist es Windows. Wenn Sie es also mit shift_jis lesen, ist es nicht in Ordnung. Von Anfang an wurde gesagt, dass Sie sich beim Lesen mit cp932 keine Gedanken über unnötige Probleme machen müssen.

import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="cp932")

Die folgende Seite war sehr hilfreich. "Lassen Sie uns die Unterschiede zwischen Shift_JIS und Windows-31J (MS932) klären." http://weblabo.oscasierra.net/shift_jis-windows31j/

Recommended Posts

Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen

So geben Sie die CSV eines mehrzeiligen Headers mit Pandas aus

Punkte, die beim Aktualisieren auf WSL2 zu beachten sind

Lesen von CSV-Dateien mit Pandas

[Python] Lesen der CSV-Datei (Methode read_csv des Pandas-Moduls)

[Python] Wie man Excel-Dateien mit Pandas liest

Zu beachtende Punkte beim Wechsel von NAOqi OS 2.4.3 zu 2.5.5

Konvertieren Sie UTF-8-CSV-Dateien in Excel

Vorsichtsmaßnahmen bei der Durchführung einer logistischen Regression mit Statsmodels

Lesen Sie die CSV-Datei: pandas

Zu beachtende Punkte beim Löschen mehrerer Elemente aus der Liste