introduction

Je veux traiter un cas où un bogue de nom de fichier se produit.

図3.png 図1.png

Même si le nom de fichier est le même en japonais, il est complètement différent selon que le code de caractère est utf-8 ou shift-jis. Grâce à l'interprétation intelligente de l'interface utilisateur qui affiche le nom du fichier, vous pouvez généralement travailler sans utiliser votre tête, mais si vous devez le faire avec python, le code de caractère est mélangé (le code de caractère diffère selon le fichier à traiter) Situation) devient très gênant. Donc, cette fois, tout en comprenant l'affichage et la conversion de chaque code de caractère, je vise à finalement convertir le nom de fichier japonais de shift-jis en utf-8, qui est la valeur par défaut de python3.

L'hypothèse est de 3 séries. ** 3 séries ** (important car lié au code de caractère). La plupart des connaissances requises pour le code de caractère dans cet article sont ** Site officiel ** (y compris les citations), et certaines Il a été obtenu sur ** ce site **.

Code de caractère assimilé au nom "Doivent être attachés à une blessure"

J'ai téléchargé l'image de «Sont à mettre sur la plaie» de Irasutoya. Ce nom semble différent selon la région (?). Dans cet article, nous traiterons la relation entre ces noms comme suit.

図8.png

Le nom «Bansokou» est [Daijirin](https://www.weblio.jp/content/%E3%81%B0%E3%82%93%E3%81%9D%E3%81%86% Il s'agit d'une nomenclature courante publiée dans E3% 81% 93% E3% 81% 86), tandis que "Cut Bang ([Yutoku Yakuhin Kogyo Co., Ltd.](https://www.yutokuyakuhin.co.jp/product/1-" 1.html)) »et« Band Aid (Johnson End Johnson Co., Ltd.) »sont des noms de produits. Je sais qu'il y a des différences de performances et de matériaux selon les sociétés de vente (je ne les ai pas comparées), mais par souci de simplicité, dans cet article, tous ces noms sont les mêmes, «sont à mettre sur la plaie». Supposons que ce soit un mot précis __. En d'autres termes, "celui à attacher à la plaie" est représenté par l'unique <nom (nom du produit) et la notation> selon les quatre types de règles de verbalisation (** code de caractère **) dans la figure. L'application de cette règle de verbalisation pour traduire

Traitement de code de caractère assimilé à "Attacher à une plaie" ~ Opération de nom de fichier déformé avec python3 ~

introduction

Code de caractère assimilé au nom "Doivent être attachés à une blessure"

`Vérifiez le code de caractère par défaut`

Encodage et décodage de "Akasatana"

`utf-8 et décalage-Comparaison de jis`

Créer un fichier qui peut être comparé à "Joindre à une plaie"

`python`

Création d'un fichier de répertoire japonais

Préparation

`Préparation: Importez le module utilisé, créez un répertoire de travail`

Créer un fichier avec utf-8

Créer un répertoire pour utf-8

`Créer un répertoire (utf-8）`

Enregistrer le fichier txt avec utf-8

`Création de fichier (utf-8）`

Créer un fichier avec shift-jis

Création de répertoire Shift-jis (par type d'octets)

`python`

Créer un répertoire shift-jis (par type str)

`Créer un répertoire (shift-jis）`

Création d'un nom de fichier txt avec shift-jis

`Création de fichier (shift-jis）`

Vérifiez le fichier enregistré une fois

Affichage de l'interface utilisateur par utf-8

Affichage de l'interface utilisateur par shift-jis

Affichage de la liste par `glob.glob ()`

`utf-8 pour afficher le nom du chemin`

`Liste des noms de chemins utilisant des octets`

Conversion de code de caractère du nom de fichier (shift-jis → utf-8)

Conversion du nom du répertoire (shift-jis)

`Conversion de code de caractère de répertoire unique`

Conversion par lots de noms de fichiers (shift-jis)

`Conversion de code de caractère de tous les fichiers du répertoire`

À la fin

Traitement de code de caractère assimilé à "Attacher à une plaie" ~ Opération de nom de fichier déformé avec python3 ~

introduction

Code de caractère assimilé au nom "Doivent être attachés à une blessure"

Vérifiez le code de caractère par défaut

Encodage et décodage de "Akasatana"

utf-8 et décalage-Comparaison de jis

Créer un fichier qui peut être comparé à "Joindre à une plaie"

python

Création d'un fichier de répertoire japonais

Préparation

Préparation: Importez le module utilisé, créez un répertoire de travail

Créer un fichier avec utf-8

Créer un répertoire pour utf-8

Créer un répertoire (utf-8）

Enregistrer le fichier txt avec utf-8

Création de fichier (utf-8）

Créer un fichier avec shift-jis

Création de répertoire Shift-jis (par type d'octets)

python

Créer un répertoire shift-jis (par type str)

Créer un répertoire (shift-jis）

Création d'un nom de fichier txt avec shift-jis

Création de fichier (shift-jis）

Vérifiez le fichier enregistré une fois

Affichage de l'interface utilisateur par utf-8

Affichage de l'interface utilisateur par shift-jis

Affichage de la liste par glob.glob ()

utf-8 pour afficher le nom du chemin

Liste des noms de chemins utilisant des octets

Conversion de code de caractère du nom de fichier (shift-jis → utf-8)

Conversion du nom du répertoire (shift-jis)

Conversion de code de caractère de répertoire unique

Conversion par lots de noms de fichiers (shift-jis)

Conversion de code de caractère de tous les fichiers du répertoire

À la fin

`Vérifiez le code de caractère par défaut`

`utf-8 et décalage-Comparaison de jis`

`python`

`Préparation: Importez le module utilisé, créez un répertoire de travail`

`Créer un répertoire (utf-8）`

`Création de fichier (utf-8）`

`python`

`Créer un répertoire (shift-jis）`

`Création de fichier (shift-jis）`

Affichage de la liste par `glob.glob ()`

`utf-8 pour afficher le nom du chemin`

`Liste des noms de chemins utilisant des octets`

`Conversion de code de caractère de répertoire unique`

`Conversion de code de caractère de tous les fichiers du répertoire`