[Python] Récupère le code de caractère du fichier

  1. Module pour obtenir le code de caractère lors de la lecture d'un fichier

-Comme il est difficile de vérifier et de définir le code de caractère à chaque lecture du fichier, j'ai créé un module pour l'acquérir automatiquement. -Il est particulièrement utile lors de l'importation de fichiers csv contenant du japonais créé dans Excel. -Il prend également en charge l'importation de fichiers sur le net. -En définissant la valeur de retour sur l'encodage au moment de l'ouverture, cela fonctionne sans problème jusqu'à présent.

def check_encoding(file_path):

'' 'Récupère le code de caractère du fichier' '' from chardet.universaldetector import UniversalDetector import requests

    detector = UniversalDetector()

    if file_path[:4] == 'http':
        r = requests.get(file_path)
        for binary in r:
            detector.feed(binary)
            if detector.done:
                break
        detector.close()

    else:
        with open(file_path, mode='rb') as f:
            for binary in f:
                detector.feed(binary)
                if detector.done:
                    break
        detector.close()

    print("  ", detector.result, end=' => ')
    print(detector.result['encoding'], end='\n')

    return detector.result['encoding']

-Il semble que csv, y compris le japonais, ait beaucoup de Shift_JIS, il semble donc préférable de le convertir en cp932 plus polyvalent dans le prochain modèle. -En entrant la valeur de retour obtenue dans le premier modèle comme argument, le nom de code de caractère optimal peut être obtenu comme valeur de retour.

def change_encoding(encoding):

'' 'Convertir la relation d'encodage sjis en cp932' '' if encoding in ['Shift_JIS', 'SHIFT_JIS', 'shift_jis', 'sjis', 's_jis']: encoding = 'cp932'

    return encoding

Supervisé, merci.

Recommended Posts

[Python] Récupère le code de caractère du fichier
Convertir le code de caractère du fichier avec Python3
[Python] [chardet] Détection automatique du code de caractère dans les fichiers
Obtenez la date de mise à jour du fichier de mémorandum Python.
[Python] Obtenez le chemin d'accès officiel du fichier de raccourci (.lnk)
Récupérer le code retour d'un script Python depuis bat
code de caractère python
Vérifier l'existence du fichier avec python
[Python3] Réécrire l'objet code de la fonction
Lisez le fichier en spécifiant le code de caractère.
Obtenir la liste de codes EDINET en Python
[PowerShell] Obtenez la lecture de la chaîne de caractères
[Python3] Comprendre les bases des opérations sur les fichiers
le zen de Python
Récupérer le contenu de git diff depuis python
[Python] Lire le code source de Bottle Part 2
[Python] Obtenir / modifier l'étiquette d'échelle de la figure
[Python] Obtenez les principaux sujets de Yahoo News
Récupérer l'appelant d'une fonction en Python
[Python] Lire le code source de Bottle Part 1
[Python] Obtenez la dernière date de mise à jour du site Web
Liens et mémos de chaînes de code de caractères Python
Code pour vérifier le fonctionnement de Python Matplot lib
[Python] Get the day (anglais et japonais)
J'ai essayé d'obtenir le code d'authentification de l'API Qiita avec Python.
Obtenez le code du pays avec python
Obtenez le nom de la variable sous forme de chaîne de caractères.
Modèle de script python pour lire le contenu du fichier
Vers la retraite de Python2
résumé lié à l'opération de fichier python
Comment obtenir le nombre de chiffres en Python
Obtenez la taille d'un fichier image sur le Web (Python3, aucune bibliothèque supplémentaire requise)
[Python] Récupérez le texte de la loi à partir de l'API e-GOV law
[python] Récupère la liste des classes définies dans le module
Décomposons les bases du code Python de TensorFlow
Obtenez le nombre de chiffres
Expliquez le code de Tensorflow_in_ROS
Obtenir la taille (nombre d'éléments) de Union Find en Python
[Python] Obtenir la liste des noms ExifTags de la bibliothèque Pillow
Obtenez l'état de fonctionnement de JR West avec Python
[Python] Obtenez le nombre de vues de tous les articles publiés
Obtenez l'URL de la destination de la redirection HTTP en Python
À propos des fonctionnalités de Python
Code de caractère appris en Python
Le pouvoir des pandas: Python
Essayez d'obtenir la liste des fonctions du paquet Python> os
Obtenez le type MIME en Python et déterminez le format de fichier
Obtenez le nombre d'éléments spécifiques dans la liste python
[Note] Importation de fichiers dans le répertoire parent en Python
Le processus de création et d'amélioration du code Python orienté objet
Commerce du système à partir de Python3: obtenez le dernier code de programme
Google recherche la chaîne sur la dernière ligne du fichier en Python
Obtenez l'index de chaque élément de la matrice de confusion en Python
Récupérez la source de la page à charger indéfiniment avec python.
Extraire le fichier xz avec python
L'histoire de Python et l'histoire de NaN
Chiffrement facile du contenu des fichiers (Python)