Ich habe die Gründe zusammengefasst, warum der folgende Fehler beim Lesen einer CSV-Datei mit Python auftritt.
import pandas as pd
pd.read_csv("file/to/path")
Ich hoffe, es ist hilfreich für diejenigen, die den folgenden Code haben, wenn sie_csv mit Pandas lesen.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 0: invalid start byte
Verwenden Sie zum Abschluss zunächst den folgenden Code.
pd.read_csv("file/to/path", encoding="shift-jis")
encoding="shift-jis"
Wenn Sie es nur anziehen, sollte es in Ordnung sein! Wenn Sie immer noch eine Fehlermeldung erhalten, lesen Sie 2 und höher und berücksichtigen Sie den Grund.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 0: invalid start byte
Erstens ist das, was diesen Fehler wütend macht, grob. Es heißt, dass die Daten nicht gelesen werden können, wenn der Zeichencode "utf-8" verwendet wird.
Zum Beispiel kann ich kein Englisch lesen, also ändere es auf Japanisch und lese dann die Daten! Es ist wie es ist.
Konvertieren wir es also in einen anderen Zeichencode. Das Konvertieren dieses Zeichencodes wird als Codierung bezeichnet.
Lassen Sie mich zur Erklärung kurz den typischen Zeichencode erläutern.
UTF-8 Es ist einer der beliebtesten Zeichencodes der Welt und eine der Codierungsmethoden für Unicode. Es wird zum Zweck der Verwendung der in ASCII definierten Zeichen wie in Unicode eingerichtet.
Abgesehen von den schwierigen Dingen hier ist es in Ordnung zu erkennen, dass es am häufigsten verwendet wird.
Es ist ein Standardzeichencode im Internet, insbesondere für E-Mails.
EUC Abkürzung für Extended Unix Code, verwendet von japanischem UNIX.
Shift_JIS Ein von Microsoft entwickelter Code, bei dem es sich um ein ASCII-Codezeichen mit hinzugefügten japanischen Zeichen handelt. Es wird auch in Windows und Mac verwendet und ist weit verbreitet für Dateien auf PCs.
** Mit anderen Worten, die CSV-Datei mit Japanisch kann von UTF-8 nicht gelesen werden. Ändern Sie sie daher in Shift_JIS **
Für diejenigen, die die Daten nach der Codierung in Shift_JIS nicht lesen konnten Überlegen Sie, in welchen der anderen Zeichencodes die Datei passt, und probieren Sie es aus.
Bis Sie ein Memo schreiben
Recommended Posts