Generieren Sie japanische Testdaten mit Python faker

Was ist Fälscher?

Überblick

Eine Bibliothek, die Dummy-Daten (Testdaten) generiert. PHP und Ruby haben ebenfalls den gleichen Namen und eine de facto Atmosphäre. https://github.com/joke2k/faker

Dieses Mal werde ich es vorstellen, damit ich Adressdaten auf Japanisch generieren kann.

Welche Art von Daten kann generiert werden

Welche Art von Daten kann Fälscher generieren? Schreiben wir zuerst ein einfaches Beispiel.

sample.py


from faker import Factory
f = Factory.create()
print f.name()
print f.address()
print f.phone_number()
print f.date()

Ausführungsergebnis


Jennie Homenick
Petramouth, WI 21918-9349
177.513.9541
1998-12-21

Die Daten werden gut generiert, aber die Standardeinstellung ist die englischsprachige Notation. Daten in anderen Sprachen können auch durch Angabe von "location" im Argument von "Factory.create" generiert werden.

Über japanische Unterstützung

Ich bin neugierig auf japanische Unterstützung, aber mit dem Commit von @ ta2xeo vor ungefähr einem Monat können Namen und Telefonnummern jetzt in japanischer Notation generiert werden.

Und diesmal habe ich es mir auch ermöglicht, eine Adresse zu generieren. Lass es uns gemeinsam sehen.

sample_ja_JP.py


from faker import Factory
f = Factory.create('ja_JP')
print f.name()
print f.phone_number()
print f.date()
print f.address()
print f.address()
print f.zipcode()
print f.prefecture()
print f.city()
print f.town()
print f.chome()
print f.ban()
print f.gou()
print f.building_name()

Ausführungsergebnis


Akemi Matsumoto
070-1472-1794
2011-03-04
11-4-20 Hanakawado, Tsurumi-ku, Yokohama-shi, Fukushima Corp. Minowa 553
31-24-20 Ujiie Nitta, Stadt Yamatake, Präfektur Toyama
121-0122
Akita
Koganei Stadt
Taitung
11th Street
Nr. 8
Nr. 13
Palast

Wie Sie sehen können, gibt es fast keine echten Adressen, weder gut noch schlecht. Es ist möglicherweise nicht möglich, konsistente Daten zu generieren, oder es werden möglicherweise keine verschiedenen japanischen Adressanzeigeformate unterstützt, aber vorerst ist es besser als die englische Notation.

Bei der Verwendung

~~ Es scheint, dass die japanische Version noch nicht für PyPI veröffentlicht wurde. ~~ ~~ Wenn Sie es verwenden möchten, installieren Sie es bitte aus dem GitHub-Repository. ~~

Da es [in Version 0.5.1 veröffentlicht] war (https://github.com/joke2k/faker/compare/v0.5...v0.5.1), sind die Schritte in diesem Abschnitt nicht erforderlich.

Datenmasken-Tool erstellen

Sie können Testdaten mit einer Bibliothek wie faker generieren, aber es gibt Fälle, in denen Dummy-Daten allein nicht funktionieren. In solchen Fällen möchte ich normalerweise einen Teil der Daten in der Produktionsumgebung maskieren und verwenden, deshalb habe ich ein Tool dafür erstellt. Natürlich benutze ich Fälscher.

Ein Tool namens Hermes, das nur bestimmte Spalten in CSV maskiert. Es ist immer noch schlecht, aber ich plane stetige Verbesserungen. https://github.com/ohbarye/Hermes

Recommended Posts

Generieren Sie japanische Testdaten mit Python faker
Laden Sie japanische Aktienkursdaten mit Python herunter
Primzahlbeurteilung mit Python
Datenanalyse mit Python 2
Primzahlbeurteilung mit Python
Datenanalyse mit Python
Erstellen Sie solche Testdaten mit Python (Teil 1)
Mit Python erstellte Beispieldaten
Senden Sie japanische Post mit Python3
Holen Sie sich Youtube-Daten mit Python
Japanische morphologische Analyse mit Python
Lesen von JSON-Daten mit Python
Ich habe versucht, mit Python faker verschiedene "Dummy-Daten" zu erstellen
[Python] Mit DataReader Wirtschaftsdaten abrufen
Python-Datenstruktur mit Chemoinfomatik gelernt
Unit Test Log Ausgabe mit Python
[Python] Generiere ein Passwort mit Slackbot
Sprechen Sie japanischen Text mit OpenJTalk + Python
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Generieren Sie gefälschte Tabellendaten mit GAN
Verarbeiten Sie Pubmed .xml-Daten mit Python
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
Anwendung von Python: Datenbereinigung Teil 2: Datenbereinigung mit DataFrame
Datenpipeline-Aufbau mit Python und Luigi
Empfangen Sie Textdaten von MySQL mit Python
[Python] Super einfacher Test mit Assert-Anweisung
Stresstest mit Locust in Python geschrieben
[Hinweis] Mit Python Daten von PostgreSQL abrufen
WebUI-Test mit Python2.6 + Selenium 2.44.0 - Profileinstellung
Verarbeiten Sie Pubmed .xml-Daten mit Python [Teil 2]
Holen Sie sich Lebensmitteldaten mit Amazon API (Python)
Versuchen Sie, mit Binärdaten in Python zu arbeiten
Konvertieren Sie Excel-Daten mit Python in JSON
Hinweise zur japanischen OCR mit Python
Bearbeiten von DynamoDB-Daten mit Lambda (Node & Python)
Wie man einen Taschentest mit Python macht
So zeigen Sie Python-Japanisch mit Lolipop an
Integration mit setuptools / python setup.py test / pytest-runder
[Python] Lassen Sie uns matplotlib mit Japanisch kompatibel machen
Empfehlung von Altair! Datenvisualisierung mit Python
Datenanalyse beginnend mit Python (Datenvorverarbeitung - maschinelles Lernen)
Lassen Sie uns MySQL-Daten mit Python bearbeiten
Wie man mit Python-Flüchen Japanisch eingibt
Organisieren Sie mit Python nach Ordnern getrennte Daten
Verarbeiten Sie Big Data mit Dataflow (ApacheBeam) + Python3
python + faker Generiere zufällig einen Punkt mit einem Radius von 100 m von einem bestimmten Punkt
Code lesen von faker, einer Bibliothek, die Testdaten in Python generiert
FizzBuzz in Python3
Scraping mit Python
Zusammenfassung des Bibliotheksvergleichs zum Generieren von PDF mit Python
Statistik mit Python
Lesen Sie Daten mit python / netCDF> nc.variables [] / Überprüfen Sie die Datengröße
Erzeugung von zwei korrelierten Pseudozufallszahlen (mit Python-Beispiel)
Probieren Sie es mit Word Cloud Japanese Python JupyterLab.
Scraping mit Python
Python mit Go