[PYTHON] Histoire autour de la maternelle, de l'école maternelle, du jardin d'enfants

Je suis actif dans Code for Kobe, mais le cadre de la réunion régulière est magiquement plein merci. Parfois, j'ai décidé d'écrire sur le calendrier de l'Avent, dans l'espoir de publier mon propre matériel. Ceci est un article du Civic Tech Advent Calendar 2016.

Récemment, j'étudie l'état des installations pour les enfants d'âge préscolaire. On en parle souvent dans les nouvelles. Je pense que les données ne sont pas clairement visibles pour le sujet, mais qu'en est-il? C'est un système compliqué, mais je suis actuellement un parti, alors j'ai commencé à collecter des données à titre d'essai.

Le nouveau système d'aide aux enfants et à l'éducation des enfants est décrit en détail sur la page du Cabinet Office. L'idée générale est de transférer ce qui était autrefois une école maternelle / maternelle à un gouvernement local en le mettant dans un système appelé «jardin d'enfants» afin qu'il puisse être exploité plus intégralement. Des avantages ont été fixés pour l'exploitation des installations. De plus, lors de l'utilisation du système, les gouvernements locaux ont pris le contrôle du quota en «certifiant» les enfants.

Ce système démarre soudainement, par exemple, sous cette forme.

"A partir de 2015, une certification est requise pour l'utilisation des jardins d'enfants et des écoles maternelles."

Expliquant grossièrement la certification, certification n ° 1 = femme au foyer à temps plein = jardin d'enfants, et certification n ° 2 et 3 = double revenu = école maternelle. La différence entre le n ° 2 et le n ° 3 est l'âge de l'enfant. Étant donné que le côté gestion veut des avantages et que les gouvernements locaux ont plus de travail de gestion, il semble qu'il existe de nombreux endroits où le fonctionnement réel est assez rigide à l'heure actuelle. .. N ° 2 = première classe, n ° 1 = économie peut ou non être. Si vous n'avez pas de cadre, vous ne pouvez pas entrer, donc par exemple, si vous avez plusieurs enfants, il peut être pratiquement impossible de passer de la certification n ° 1 à la certification n ° 2. Quand cela devient une école élémentaire, c'est l'enseignement obligatoire et vous serez certainement admis dans une école du district scolaire, vous serez donc surpris de l'écart dans le système.

Maintenant. Bien qu'il s'agisse d'un système si nouveau, divers gouvernements locaux subissent actuellement des changements de système. En fait, il arrive assez souvent que les jardins d'enfants deviennent des jardins d'enfants. En d'autres termes, la liste des jardins d'enfants, des écoles maternelles et des jardins d'enfants est mise à jour plus fréquemment que prévu. Il est difficile de suivre le rythme, même si cela dépend de la vie.

Peut-être en raison d'une telle situation, il semble que les cartes des écoles maternelles soient activement créées. Carte de la pépinière projet fork fait avec Code for Sapporo Il y en a Cela semble être actif. En plus de cela, par exemple, la ville d'Osaka semble maintenir sa propre carte. Il semble qu'un événement de création de données soit également organisé, donc cela semble amusant. Jaloux.

Mais bon, qu'est-ce que c'est? Même ainsi, je veux vraiment que les données d'origine soient des données ouvertes, et je ne veux pas que tout le monde travaille dur sur la maintenance des données sur une base régulière, et je pense que cela devrait être ainsi. La durabilité est importante, et se débarrasser des informations obsolètes et en prendre soin peut être coûteux et ridicule.

Juste au Barcelona Workshop à Kobe City, [maintenez] les données de Kobe City [https://github.com/hkwi/our-data/blob/ master / shinseido.json) J'ai fait un travail (http://hkwi.github.io/kobe-barcelona/), j'ai donc élargi la portée et essayé de collecter des données dans toute la préfecture de Hyogo. La durabilité est importante, je ferai donc de mon mieux pour l'automatiser.

Tout d'abord, visons la liste des installations. J'ai extrait les données et l'ai essayé avec la ligne "Je vais essayer d'extraire la partie en forme de surface". Le référentiel est situé sur U5. La source de données est ʻu5 / task28.py, et celle qui peut être détectée est [all.ttl](https://hkwi.github.io/U5/all.ttl). «RDF» est bon pour ce genre de données, «Je ne sais pas s'il y en a, je ne sais pas combien. C'est assez difficile avec csv et json`.

Et ça. C'est intéressant car vous pouvez voir différentes habitudes.

―― «・» est souvent utilisé. Cependant, une chaîne qui est interdite par le nom préfixé de Turtle. ―― Les nombres demi-largeur sont souvent inclus dans l'en-tête. --Parfois, les sauts de ligne ont la signification de délimiteurs de données (dans les cellules) -L'apparence peut être ajustée dans un espace pleine largeur

Généralement, lorsque nous disons «je veux des données», nous entendons «données structurées» ou «données semi-structurées». Si c'est une table, cela vous donnera une structure, donc c'est un peu mieux. Ce qui n'est même pas dans le tableau est une lettre si elle peut être déduite de la structure du document et transformée d'une manière ou d'une autre en données structurées. Le PDF est très difficile à utiliser car il détruit même une fois la structure du document.

De plus, même s'il s'agit d'une table, c'est gênant s'il ne s'agit pas de données structurées. Il va sans dire que "Neshin Excel" est hors de question, mais il n'est pas non plus bon d'exprimer la structure des données dans les cellules du tableau avec des sauts de ligne, des parenthèses et d'autres règles de chaîne de caractères. «Cellule = une donnée» est souhaitable. Vous devez également arrêter de saisir des espaces pour ajuster l'apparence. C'est juste la même histoire que «HTML» ne doit pas être utilisé pour ajuster l'apparence de «table». Si vous effacez ces deux éléments, la convivialité sera bien meilleure. Même en HTML, il a fallu un temps considérable pour que la mise en page du tableau soit expulsée, il semble donc que cela prendra également un certain temps. Dans tous les cas, la situation actuelle est que l'apparence et le contenu sont intégrés et distribués, il est donc vrai que ceux-ci se trouvent dans un environnement facile à entretenir sans distinction. Peut-être que je parle de Data Academy.

Ce qui suit est extrait comme ce qui semble être un nom de champ. Principalement pour les fichiers. Il y a plus de types que ce à quoi je m'attendais.

Cela semble difficile à assembler tout en supprimant la fluctuation de la notation. Imminemment, je me demande comment organiser les informations lorsque la liste actuelle et la liste future (prévue) sont publiées en même temps. Je dois géocoder pour le mettre sur la carte. Je veux quelque chose qui a effacé la licence.

J'espère que les données seront diffusées rapidement et avec un bon sentiment.

Figure de "données ouvertes 5 étoiles"

Histoire du déraillement n ° 1. Lorsque vous commencez avec des données ouvertes, vous voyez souvent le chiffre de données ouvertes 5 étoiles. Pour être honnête, j'en ai marre de ça. Ce qui est écrit dans le texte est décent. Il est normal de le lire attentivement. Cependant, l'image est une propagande selon laquelle "LOD est le meilleur". C'est un discours de position, alors n'ayez pas peur.

Si vous regardez vers l'avenir et pensez à exploiter des données ouvertes maintenant, vous devriez regarder la réalité. J'écrirai les caractéristiques de chacun que je pense utiliser.

LOD

RDF

--Doit être traité sous la forme d'un triple --NULL peut être exprimé par l'absence de triplets

CSV

--Sans commentaire --colspan et rowspan ne peuvent pas être utilisés --Il y a une compréhension implicite que la première ligne est l'en-tête et que Multi-index ne peut pas être utilisé.

Excel

--Il n'y a pas d'autre choix que de deviner la zone de données

PDF

Excel n'est-il pas raisonnable à ce stade pour les mises à jour manuelles? Par exemple, vous pouvez le lire avec pandas.read_excel. C'est cool d'étendre l'Open Packaging Convention aux schémas groupés. CSV n'est jamais toujours meilleur qu'Excel.

En outre, les données de table doivent être conservées sous forme de table tant que la table est correctement représentée. Il vaut mieux mettre l'accent sur les ** coûts de maintenance **. Il y a certaines choses qui peuvent être réalisées en utilisant triple (distribution de données et référentiel), mais c'est assez facile à automatiser.

Le tableau HTML est également facile à utiliser.

Problème social?

Déraillement # 2. En regardant la technologie Civic, je vois quelque chose comme «résoudre les problèmes sociaux» et «créer des affaires». Je pense que je fais moi-même de la technologie Civic, mais ni l'un ni l'autre ne semble être le cas. Tout en travaillant comme employée de bureau, je sens que je veux au moins organiser personnellement mes effets personnels de manière moderne.

En fait, celui qui, à mon avis, est le plus "inopinément utilisable" actuellement est Calendarization of lunch.

Bien sûr, il est important de résoudre les problèmes sociaux et de créer des entreprises, mais j'espère que les activités qui rendent simplement la vie des gens confortables seront reconnues comme des technologies civiques. La maintenance des données de la maternelle / crèche se fait également de la manière suivante: «qu'est-ce qui sera résolu?», «Que ferez-vous alors?» Et «est-ce rentable?», Mais il est difficile de répondre.

Code for Kobe

Déraillement n ° 3. Chez Code for Kobe, nous nous réjouissons de votre participation. Il n'y a pas d'éligibilité pour participer. Si vous avez des questions, n'hésitez pas à demander! → page Facebook

Recommended Posts

Histoire autour de la maternelle, de l'école maternelle, du jardin d'enfants
Une histoire sur Python pop and append
Une histoire accro aux variables globales et à la portée de Go
Une histoire sur la modification de Python et l'ajout de fonctions
Une histoire rafraîchissante sur Slice en Python
Une histoire de mauvaise humeur sur Slice en Python
L'histoire de l'utilisation de la réduction de Python
Une histoire d'essayer d'exécuter JavaScripthon sur Windows et d'abandonner.
L'histoire d'avoir un regard doux et douloureux sur les utilisateurs personnalisés sur Django
Une histoire sur l'automatisation du mahjong en ligne (Jakutama) avec OpenCV et l'apprentissage automatique
L'histoire de l'abandon d'essayer de se connecter à MySQL en utilisant Heroku
Une histoire sur un remodelage magique qui met Lubuntu dans un Chromebook
Une histoire reliant Slack et la feuille de calcul Google
Une histoire sur l'apprentissage automatique avec Kyasuket
Une histoire d'essayer d'installer uwsgi sur une instance EC2 et d'échouer
Une histoire de compilation croisée d'un package Python pour AWS Lambda et de son déploiement sans serveur
À propos de _ et __
Une histoire sur l'apprentissage automatique simple avec TensorFlow
Une histoire sur l'exploitation d'une instance GCP à partir de Discord
L'histoire de vouloir afficher des annonces liées à des articles sur Jubatus
Une histoire sur l'implémentation d'un écran de connexion avec django
Une histoire sur l'exécution de Python sur PHP sur Heroku
Histoire de l'analyse de données par apprentissage automatique