Voici deux façons de convertir le code de caractère d'un fichier avec Python3.
Cette fois, j'ai un fichier CSV avec le code de caractère "shift-jis", et j'écrirai le code pour le convertir en "utf-8".
Vous pouvez lire et écrire des fichiers en spécifiant le code de caractère à l'aide de codecs.
utf8_test1.py
# -*- coding:utf-8 -*-
import codecs
def main():
    # Shift_Chemin du fichier JIS
    shiftjis_csv_path = './download/shift_jis_data.csv'
    # UTF-8 Chemin du fichier
    utf8_csv_path = './download/utf8_data.csv'
    #Code de caractère utf-Convertissez en 8 et économisez
    fin = codecs.open(shiftjis_csv_path, "r", "shift_jis")
    fout_utf = codecs.open(utf8_csv_path, "w", "utf-8")
    for row in fin:
        fout_utf.write(row)
    fin.close()
    fout_utf.close()
if __name__ == '__main__':
    main()
Vous pouvez convertir le code de caractère en appelant la commande nkf depuis Python.
utf8_test2.py
# -*- coding:utf-8 -*-
import subprocess
def main():
    # Shift_Chemin du fichier JIS
    shiftjis_csv_path = './download/shift_jis_data.csv'
    # UTF-8 Chemin du fichier
    utf8_csv_path = './download/utf8_data.csv'
    cmd = "nkf -w %s > %s" % (shiftjis_csv_path, utf8_csv_path)
    subprocess.call(cmd, shell=True)
if __name__ == '__main__':
    main()
Cependant, nkf n'est pas une fonctionnalité Python, vous devez donc avoir nkf installé à l'avance.
$ brew install nkf
Recommended Posts