[PYTHON] Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen

Wenn Sie möchten, dass Python es liest, möchte ich, dass das Zeichenformat utf-8 ist. Da es auf der Datenausgabeseite verschiedene Gründe gibt, muss die empfangende Seite in vielen Fällen konvertieren und lesen.

Die CSV-Ausgabe in der Windows- und Excel-Umgebung ist Shift-JIS. .. .. Also, mit Pandas,

import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="shift_jis")

Wenn Sie dies tun, können Sie es möglicherweise nicht richtig lesen, wenn Sie nicht vorsichtig sind, weil Sie denken, dass es in Ordnung ist.

test.csv


Yamada,1000
Sato,2000
Yamamoto,3000

Ich kann das lesen,

test2.csv


1,Yamada,1000
2,Takahashi,2000
3,Schwarz 﨑,3000

Ich erhalte ausnahmslos den folgenden Fehler. .. ..

UnicodeDecodeError: 'shift_jis' codec can't decode byte 0xfb in position 0: illegal multibyte sequence

Dies ist in test2.csv, ・ Hashigodaka "** Taka " ・ Tachisaki " Saki **" Dies liegt daran, dass die Zeichenfolge der Windows-Erweiterung gemischt ist. Um solche Zeichen lesen zu können, muss der Zeichencode cp932 sein.

encoding='cp932'

Aus diesem Grund ist es Windows. Wenn Sie es also mit shift_jis lesen, ist es nicht in Ordnung. Von Anfang an wurde gesagt, dass Sie sich beim Lesen mit cp932 keine Gedanken über unnötige Probleme machen müssen.

import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="cp932")

Recommended Posts

Zu beachtende Punkte, wenn Pandas CSV der Excel-Ausgabe lesen
So geben Sie die CSV eines mehrzeiligen Headers mit Pandas aus
Punkte, die beim Aktualisieren auf WSL2 zu beachten sind
Lesen von CSV-Dateien mit Pandas
[Python] Lesen der CSV-Datei (Methode read_csv des Pandas-Moduls)
[Python] Wie man Excel-Dateien mit Pandas liest
Zu beachtende Punkte beim Wechsel von NAOqi OS 2.4.3 zu 2.5.5
Konvertieren Sie UTF-8-CSV-Dateien in Excel
Vorsichtsmaßnahmen bei der Durchführung einer logistischen Regression mit Statsmodels
Lesen Sie die CSV-Datei: pandas
Zu beachtende Punkte beim Löschen mehrerer Elemente aus der Liste
[Python] So geben Sie eine Pandas-Tabelle in eine Excel-Datei aus
Lesen einer Excel-Datei (.xlsx) mit Pandas [Python]
(Hinweis) Punkte, auf die Sie bei der Installation von Scilab unter ArchLinux achten sollten
Lesen Sie CSV mit Python-Pandas
Exportieren Sie den Pandas-Datenrahmen nach Excel
So fügen Sie eine CSV-Datei mit Pandas in eine Excel-Datei ein
Ein Hinweis, von dem ich süchtig war, als ich unter Linux einen Piepton machte
[Hinweis] Umgang mit Unicode-Fehlern und Keine solche Datei oder kein solches Verzeichnis (Ausgabe der Tabelle zur Excel-Datei mit Pandas)
Ausgabe in eine CSV-Datei mit Python
Etosetra im Zusammenhang mit Pandas read_csv
[Django] Befehl zum Ausgeben von QuerySet an csv
So ändern Sie mehrere Spalten von csv in Pandas (Unixtime-> Japan Time)
Python Hinweis: Wenn Sie die Attribute eines Objekts kennen möchten
Zusammenfassung der von Pandas 1 häufig ausgeführten Prozesse (CSV-, Excel-Datei-bezogene Vorgänge)
Ein Hinweis bei der Suche nach einer Alternative zu Pandas, die für ein bewegliches Fenster rollen