Générer des données de test japonais avec Python Faker

Qu'est-ce qu'un faux

Aperçu

Une bibliothèque qui génère des données factices (données de test). PHP et Ruby ont également le même nom, et il a une atmosphère de facto. https://github.com/joke2k/faker

Cette fois, je vais le présenter pour que je puisse générer des données d'adresse en japonais.

Quel type de données peut être généré

Quel type de données le faker peut-il générer? Écrivons d'abord un exemple simple.

sample.py


from faker import Factory
f = Factory.create()
print f.name()
print f.address()
print f.phone_number()
print f.date()

Résultat d'exécution


Jennie Homenick
Petramouth, WI 21918-9349
177.513.9541
1998-12-21

Cela générera bien les données, mais la valeur par défaut est la notation anglophone. Les données dans d'autres langues peuvent également être générées en spécifiant «location» dans l'argument de «Factory.create».

À propos du support japonais

Je suis curieux de connaître le support japonais, mais avec le commit de @ ta2xeo il y a environ un mois, les noms et numéros de téléphone peuvent maintenant être générés en notation japonaise.

Et cette fois, j'ai également permis de générer une adresse. Voyons cela ensemble.

sample_ja_JP.py


from faker import Factory
f = Factory.create('ja_JP')
print f.name()
print f.phone_number()
print f.date()
print f.address()
print f.address()
print f.zipcode()
print f.prefecture()
print f.city()
print f.town()
print f.chome()
print f.ban()
print f.gou()
print f.building_name()

Résultat d'exécution


Akemi Matsumoto
070-1472-1794
2011-03-04
11-4-20 Hanakawado, Tsurumi-ku, Yokohama-shi, Fukushima Corp. Minowa 553
31-24-20 Ujiie Nitta, Yamatake City, Toyama Prefecture
121-0122
Akita
Ville de Koganei
Taitung
11e rue
N ° 8
N ° 13
Palais

Comme vous pouvez le voir, il n'y a presque pas de vraies adresses, bonnes ou mauvaises. Il peut ne pas être possible de générer des données cohérentes, ou il peut ne pas prendre en charge divers formats d'affichage d'adresses japonais, mais pour le moment, c'est mieux que la notation anglaise.

À l'aide de

~~ Il semble que la version japonaise n'ait pas encore été publiée sur PyPI. ~~ ~~ Si vous souhaitez l'utiliser, veuillez l'installer à partir du référentiel GitHub. ~~

Puisqu'il a été publié en v0.5.1, les étapes de cette section sont inutiles.

Création d'un outil de masque de données

Les données de test peuvent être générées avec une bibliothèque telle que faker, mais il existe des cas où les données factices seules ne fonctionnent pas. Dans de tels cas, je souhaite généralement masquer une partie des données dans l'environnement de production et l'utiliser, j'ai donc créé un outil pour cela. Bien sûr, j'utilise faker.

Un outil appelé Hermes qui ne masque que des colonnes spécifiques en CSV. Il est encore médiocre, mais je compte apporter des améliorations constantes. https://github.com/ohbarye/Hermes

Recommended Posts

Générer des données de test japonais avec Python Faker
Téléchargez les données de cours des actions japonaises avec Python
Jugement des nombres premiers avec Python
Analyse de données avec python 2
Jugement des nombres premiers avec python
Analyse de données avec Python
Créez des données de test comme ça avec Python (partie 1)
Exemple de données créées avec python
Envoyer du courrier japonais avec Python3
Obtenez des données Youtube avec python
Analyse morphologique japonaise avec Python
Lire des données json avec python
J'ai essayé de créer diverses "données factices" avec Python faker
[Python] Obtenez des données économiques avec DataReader
Structure de données Python apprise avec la chimioinfomatique
Sortie du journal de test unitaire avec python
[Python] Générer un mot de passe avec Slackbot
Parlez du texte japonais avec OpenJTalk + python
Visualisez facilement vos données avec Python seaborn.
Générer de fausses données de table avec GAN
Traiter les données Pubmed .xml avec python
Analyse de données à partir de python (visualisation de données 1)
Analyse de données à partir de python (visualisation de données 2)
Application de Python: Nettoyage des données Partie 2: Nettoyage des données à l'aide de DataFrame
Construction de pipeline de données avec Python et Luigi
Recevoir des données textuelles de mysql avec python
[Python] Test super facile avec instruction assert
Test de stress avec Locust écrit en Python
[Note] Obtenir des données de PostgreSQL avec Python
Test WebUI avec Python2.6 + Selenium 2.44.0 - paramètre de profil
Traiter les données Pubmed .xml avec python [Partie 2]
Obtenez des données alimentaires avec l'API Amazon (Python)
Essayez de travailler avec des données binaires en Python
Convertir des données Excel en JSON avec python
Remarques sur la réalisation de l'OCR japonais avec Python
Manipulation des données DynamoDB avec Lambda (Node et Python)
Convertissez des données FX 1 minute en données 5 minutes avec Python
Comment faire un test de sac avec python
Comment afficher le japonais python avec lolipop
Intégration avec setuptools / python setup.py test / pytest-runner
[Python] Rendons matplotlib compatible avec le japonais
Recommandation d'Altair! Visualisation des données avec Python
Analyse de données à partir de python (pré-traitement des données-apprentissage automatique)
Faisons la manipulation des données MySQL avec Python
Comment entrer le japonais avec les malédictions Python
Organisez les données séparées par dossier avec Python
Traitez le Big Data avec Dataflow (ApacheBeam) + Python3
python + faker Générer aléatoirement un point avec un rayon de 100m à partir d'un certain point
Lecture de code de faker, une bibliothèque qui génère des données de test en Python
FizzBuzz en Python3
Grattage avec Python
Résumé de la comparaison des bibliothèques pour générer des PDF avec Python
Statistiques avec python
Lire les données avec python / netCDF> nc.variables [] / Vérifier la taille des données
Génération de deux nombres pseudo-aléatoires corrélés (avec exemple Python)
Essayez-le avec JupyterLab en Python japonais Word Cloud.
Grattage avec Python
Python avec Go