J'ai résumé les raisons pour lesquelles l'erreur suivante apparaît lors de la lecture d'un fichier csv avec python.
import pandas as pd
pd.read_csv("file/to/path")
J'espère que cela sera utile pour ceux qui ont le code suivant lors de la lecture de_csv avec des pandas.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 0: invalid start byte
Pour conclure d'abord, veuillez utiliser le code ci-dessous.
pd.read_csv("file/to/path", encoding="shift-jis")
encoding="shift-jis"
Si vous venez de le mettre, ça devrait être OK! Si vous obtenez toujours une erreur, lisez 2 et plus tard et considérez la raison.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 0: invalid start byte
En premier lieu, ce qui met cette erreur en colère est grossier. Il indique que les données ne peuvent pas être lues si le code de caractère "utf-8" est utilisé.
Par exemple, je ne peux pas lire l'anglais, alors changez-le en japonais, puis lisez les données! C'est comme ça.
Alors convertissons-le en un autre code de caractère. La conversion de ce code de caractère est appelée encodage.
Afin de l'expliquer, laissez-moi vous expliquer brièvement le code de caractère typique.
UTF-8 C'est l'un des codes de caractères les plus populaires au monde et l'une des méthodes de codage pour Unicode. Il est établi dans le but d'utiliser les caractères définis en ASCII comme ils le sont en Unicode.
Mis à part les choses difficiles ici, il est normal de reconnaître que c'est le plus utilisé.
Il s'agit d'un code de caractères standard sur Internet, en particulier pour les e-mails.
EUC Abréviation de Extended Unix Code, utilisée par UNIX japonais.
Shift_JIS Un code développé par Microsoft, qui est un caractère de code ASCII avec des caractères japonais ajoutés. Il est également utilisé sous Windows et Mac et est largement utilisé pour les fichiers sur PC.
** En d'autres termes, le fichier csv contenant du japonais ne peut pas être lu par UTF-8, changez-le donc en Shift_JIS **
Pour ceux qui n'ont pas pu lire les données après l'encodage en Shift_JIS Pensez à quel autre code de caractère le fichier s'insère et essayez-le.
Au moment où vous écrivez un mémo