[PYTHON] Je l'ai fait parce que je veux des données JSON qui peuvent être utilisées librement dans les démos et les prototypes

La raison de penser

Quand j'ai une idée de nouvelle application Web ou bibliothèque, je réalise parfois un prototype pour l'expliquer à d'autres.

Laissez le style par défaut du navigateur sans écrire de CSS, toutes les images sont des carrés gris, et le texte est facile s'il s'agit de "○○○" ou "dummy dummy dummy", mais ce n'est pas intéressant après tout.

Dans un tel cas, si vous utilisez Bootstrap etc. pour la conception et sélectionnez l'image à partir de matériaux gratuits, vous pouvez créer un joli prototype sans perdre trop de temps.

Cependant, quand je voulais 100 phrases courtes, 100 noms, 100 adresses, etc., je devais tout faire à la main, comme générer automatiquement des données factices ou trouver les données quelque part. Même si les données sont trouvées, elles sont souvent difficiles à utiliser telles quelles et un traitement est nécessaire.

Au fur et à mesure que cela continuait, j'en suis venu à penser que ce serait bien s'il y avait des données gratuites.

J'ai essayé de le faire

Je l'ai cherché à nouveau au cas où, mais je ne pouvais pas trouver de matériel gratuit avec des données qui semblaient faciles à utiliser, alors j'ai décidé de l'essayer quand même.

J'ai pensé que ce serait mieux si le format de données était unifié, j'ai donc choisi JSON qui est facile à lire dans n'importe quelle langue. Je voulais utiliser un service comme lieu d'enregistrement, mais je n'ai pas trouvé d'endroit raisonnable, alors j'ai créé le site.

FreeJSON.net - Données JSON gratuites et gratuites http://freejson.net

Comme point de départ, j'ai rassemblé les 400 premiers caractères de chaque œuvre d'Aozora Bunko, pensant que cela pourrait être un peu intéressant comme le nom d'une personne et les données des étudiants actifs à Takarazuka (ce que l'on appelle Takara Jenne est appelé un étudiant) et les données textuelles du site d'affichage. J'ai essayé d'enregistrer des données, etc.

Impressions réalisées

Il est étonnamment intéressant de créer réellement les données. Quand je fais un prototype, c'est différent du but, donc j'ai envie de le faire, mais quand le but est de faire des données, mon humeur change.

Aussi, il est intéressant de simplement regarder les données des étudiants de Takarazuka et les données d'Aozora Bunko. Je vais collecter régulièrement des données pendant un certain temps. Après avoir mis à jour les données, je tweeterai avec la balise de hachage #FreeJSON.

Étant donné que les données qui peuvent être créées par une personne sont connues, il peut être bon de créer un mécanisme de type bibliothèque qui collecte ces données.

mettre à jour les informations

2016-08-06 Ajout d'une liste d'inscriptions au matcha 06/08/2016 Ajout d'un menu de boissons qui semble être dans le café 2016-08-02 Ajout de mots pour respirer profondément, Hirofumi Goto (du projet de mots pour prendre une profonde respiration http://shin-kokyu.jp) 2016-08-01 Ajout d'une liste de kanji communs (fournie par @wakufactory) 2016-08-01 Ajout d'informations sur les musées japonais (avec informations de latitude et de longitude)

Recommended Posts

Je l'ai fait parce que je veux des données JSON qui peuvent être utilisées librement dans les démos et les prototypes
Étant donné que ImageDataGenerator ne peut plus être utilisé, une histoire sur la création d'une classe d'extension de données pour tensorflow> = 2.0
Remplissage facile des données pouvant être utilisées dans le traitement du langage naturel
J'ai écrit un tri-arbre qui peut être utilisé pour l'implémentation de dictionnaire à grande vitesse en langage D et Python
Fonctions pouvant être utilisées dans l'instruction for
Je souhaite créer une file d'attente prioritaire pouvant être mise à jour avec Python (2.7)
Programme d'installation facile et programme de mise à jour automatique pouvant être utilisé dans n'importe quelle langue
Algorithmes de base utilisables par les pros de la compétition
Enregistrement d'image ANT qui peut être utilisé en 5 minutes
J'ai créé un outil pour générer automatiquement un diagramme de transition d'état pouvant être utilisé à la fois pour le développement Web et le développement d'applications
Installez Mecab et CaboCha sur ubuntu16.04LTS afin qu'il puisse être utilisé à partir de la série python3
[Django] Noms de champs pouvant être utilisés pour le modèle utilisateur, l'enregistrement des utilisateurs et les méthodes de connexion
[Python3] Code qui peut être utilisé lorsque vous souhaitez redimensionner des images dossier par dossier
[Atcoder] [C ++] J'ai fait un outil d'automatisation de test qui peut être utilisé pendant le concours
Goroutine (contrôle parallèle) utilisable sur le terrain
Goroutine utilisable sur le terrain (édition errgroup.Group)
Scripts pouvant être utilisés lors de l'utilisation de Bottle en Python
Je veux que Sphinx soit pratique et utilisé par tout le monde
J'ai essayé de l'étendre pour que la base de données puisse être utilisée avec le logiciel d'analyse de Wiire
J'ai entendu des rumeurs selon lesquelles malloc est lent et devrait être stocké en mémoire, alors je l'ai comparé.
J'ai acheté et analysé la loterie jumbo de fin d'année avec Python qui peut être exécutée dans Colaboratory
[Python] J'ai créé ma propre bibliothèque qui peut être importée dynamiquement
Un minuteur (ticker) qui peut être utilisé sur le terrain (peut être utilisé n'importe où)
Gestion des chaînes de caractères dans la communication JSON
J'ai fait un shuffle qui peut être réinitialisé (inversé) avec Python
Je veux créer un fichier pip et le refléter dans le menu fixe
Résumé de l'entrée standard de Python pouvant être utilisée dans Competition Pro
Puis-je être un data scientist?
J'ai essayé de créer un environnement capable d'acquérir, de stocker et d'analyser les données de tweet en WSL (bash)
J'ai créé un modèle de projet Python générique
J'ai mis Alpine Linux dans Larkbox et en ai fait mon serveur domestique
J'ai créé un bot Discord en Python qui se traduit quand il réagit
J'ai fait une simple minuterie qui peut être démarrée depuis le terminal
J'ai créé un programme en Python qui lit les données FX CSV et crée un grand nombre d'images de graphiques
J'ai essayé de créer une classe qui peut facilement sérialiser Json en Python
[2015.02.22] Youtube-dl a été mis à jour et ne peut plus être utilisé dans les versions précédentes.
Notes personnelles des opérations liées aux pandas qui peuvent être utilisées dans la pratique
Résumé des sources de données scikit-learn pouvant être utilisées lors de la rédaction d'articles d'analyse
Notez que je comprends l'algorithme des moindres carrés. Et je l'ai écrit en Python.
[Python] Aucun J'ai créé nullutil.py car il était encombré de vérifications et de branchements.
Commande Linux (édition de base) utilisable à partir d'aujourd'hui si vous connaissez
Cela peut être réalisé en 1 minute! Le décorateur qui met en cache l'exécution de la fonction entraîne Memcached
J'ai essayé de créer OneHotEncoder, qui est souvent utilisé pour l'analyse des données, afin qu'il puisse atteindre l'endroit qui démange.