Wenn Sie möchten, dass Python es liest, möchte ich, dass das Zeichenformat utf-8 ist. Da es auf der Datenausgabeseite verschiedene Gründe gibt, muss die empfangende Seite in vielen Fällen konvertieren und lesen.
Die CSV-Ausgabe in der Windows- und Excel-Umgebung ist Shift-JIS. .. .. Also, mit Pandas,
import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="shift_jis")
Wenn Sie dies tun, können Sie es möglicherweise nicht richtig lesen, wenn Sie nicht vorsichtig sind, weil Sie denken, dass es in Ordnung ist.
test.csv
Yamada,1000
Sato,2000
Yamamoto,3000
Ich kann das lesen,
test2.csv
1,Yamada,1000
2,Takahashi,2000
3,Schwarz 﨑,3000
Ich erhalte ausnahmslos den folgenden Fehler. .. ..
UnicodeDecodeError: 'shift_jis' codec can't decode byte 0xfb in position 0: illegal multibyte sequence
Dies ist in test2.csv, ・ Hashigodaka "** Taka " ・ Tachisaki " Saki **" Dies liegt daran, dass die Zeichenfolge der Windows-Erweiterung gemischt ist. Um solche Zeichen lesen zu können, muss der Zeichencode cp932 sein.
encoding='cp932'
Aus diesem Grund ist es Windows. Wenn Sie es also mit shift_jis lesen, ist es nicht in Ordnung. Von Anfang an wurde gesagt, dass Sie sich beim Lesen mit cp932 keine Gedanken über unnötige Probleme machen müssen.
import pandas as pd
dataset1 = pd.read_csv("hogehoge.csv",encoding="cp932")
Recommended Posts