[PYTHON] Eine Geschichte über Kindergärten, Kindergärten und Kindergärten

Ich bin in Code for Kobe aktiv, aber der Rahmen des regulären Treffens ist magisch voll, danke. Gelegentlich beschloss ich, in den Adventskalender zu schreiben, in der Hoffnung, mein eigenes Material herauszubringen. Dies ist ein Artikel aus Civic Tech Adventskalender 2016.

Kürzlich untersuche ich den Status von Einrichtungen für Kinder im Vorschulalter. In den Nachrichten wird oft darüber gesprochen. Ich habe das Gefühl, dass die Daten für das Thema nicht klar sichtbar sind, aber was ist damit? Es ist ein kompliziertes System, aber ich bin derzeit eine Partei, also habe ich angefangen, Daten probeweise zu sammeln.

Das neue System zur Unterstützung von Kindern und zur Kindererziehung wird ausführlich auf der Seite des Kabinetts beschrieben. Die allgemeine Idee besteht darin, einen ehemaligen Kindergarten / Kindergarten an eine lokale Regierung zu übertragen, indem er in ein System namens "Kindergarten" eingebunden wird, damit er integraler betrieben werden kann. Für den Betrieb der Anlage wurden Vorteile festgelegt. Darüber hinaus erlangten die lokalen Regierungen die Kontrolle über die Quote, indem sie Kinder bei der Nutzung des Systems "zertifizierten".

Dieses System startet beispielsweise plötzlich in dieser Form.

"Ab 2015 ist eine Zertifizierung für die Nutzung von Kindergärten und Kindergärten erforderlich."

Grobe Erklärung der Zertifizierung, Nr. 1-Zertifizierung = Vollzeit-Hausfrau = Kindergarten und Nr. 2- und 3-Zertifizierung = Doppeleinkommen = Kindergarten. Der Unterschied zwischen Nr. 2 und Nr. 3 ist das Alter des Kindes. Da die Managementseite Vorteile wünscht und die lokalen Regierungen die Managementarbeit erhöhen, weil sie Geld bezahlen, aber auch reden, scheint es viele Orte zu geben, an denen die tatsächliche Operation derzeit ziemlich starr ist. .. Nr. 2 = erste Klasse, Nr. 1 = Wirtschaftlichkeit kann oder kann nicht sein. Wenn Sie keinen Rahmen haben, können Sie nicht teilnehmen. Wenn Sie beispielsweise mehrere Kinder haben, ist es möglicherweise praktisch unmöglich, von der Zertifizierung Nr. 1 zur Zertifizierung Nr. 2 zu wechseln. Wenn dies eine Grundschule wird, ist es eine Schulpflicht, und Sie werden definitiv in eine Schule im Schulbezirk aufgenommen, sodass Sie über die Lücke im System überrascht sein werden.

Jetzt. Obwohl es sich um ein so neues System handelt, werden derzeit von verschiedenen Kommunalverwaltungen Systemänderungen vorgenommen. Tatsächlich kommt es häufig vor, dass Kindergärten zu Kindergärten werden. Mit anderen Worten, die Liste der Kindergärten, Kindergärten und Kindergärten wird häufiger aktualisiert als erwartet. Es ist schwer, damit Schritt zu halten, obwohl es vom Leben abhängt.

Vielleicht scheint es aufgrund einer solchen Situation so, dass die Erstellung von Kindergartenkarten aktiv durchgeführt wird. Nursery Map Projektgabel mit Code für Sapporo Es gibt einige Aktiv Es scheint aktiv zu sein. Darüber hinaus scheint Osaka City beispielsweise eine eigene [Karte] zu haben (http://www.city.osaka.lg.jp/kodomo/page/0000261192.html). Es scheint, dass auch ein Datenerstellungsereignis stattfindet, also scheint es Spaß zu machen. Eifersüchtig.

Aber was ist das? Trotzdem möchte ich wirklich, dass die Originaldaten offene Daten sind, und ich möchte nicht, dass jeder regelmäßig hart an der Datenpflege arbeitet, und ich denke, es sollte so sein, wie es sein sollte. Nachhaltigkeit ist wichtig, und veraltete Informationen loszuwerden und zu pflegen kann kostspielig und lächerlich sein.

Nur auf dem Barcelona Workshop in Kobe City [pflegen] Sie die Daten von Kobe City [https://github.com/hkwi/our-data/blob/ master / shinseido.json) Ich habe eine Arbeit gemacht (http://hkwi.github.io/kobe-barcelona/), also habe ich den Umfang erweitert und versucht, Daten in der gesamten Präfektur Hyogo zu sammeln. Nachhaltigkeit ist wichtig, deshalb werde ich mein Bestes geben, um sie zu automatisieren.

Lassen Sie uns zunächst auf die Einrichtungsliste zielen. Ich zog die Daten und versuchte es mit der Zeile "Ich werde versuchen, den oberflächenähnlichen Teil zu extrahieren". Das Repository befindet sich unter U5. Die Datenquelle ist "u5 / task28.py", und die erkennbare ist all.ttl. "RDF" ist gut in dieser Art von Daten. "Ich weiß nicht, ob es solche gibt, ich weiß nicht, wie viele". Es ist ziemlich schwierig mit csv und json.

Wie wär es damit. Es ist interessant, weil Sie verschiedene Gewohnheiten sehen können.

―― “・” wird oft verwendet. Zeichenfolgen, die durch den vorangestellten Namen von Turtle verboten sind. ――Halbbreitenzahlen sind häufig in der Überschrift enthalten.

Wenn wir "Ich möchte Daten" sagen, meinen wir im Allgemeinen "strukturierte Daten" oder "halbstrukturierte Daten". Wenn es sich um eine Tabelle handelt, erhalten Sie eine Struktur, die etwas besser ist. Was nicht einmal in der Tabelle steht, ist ein Brief, wenn er weiter aus der Dokumentstruktur abgeleitet und irgendwie zu strukturierten Daten verarbeitet werden kann. PDF ist sehr schwierig zu verwenden, da es sogar die Dokumentstruktur einmal zerstört.

Auch wenn es sich um eine Tabelle handelt, ist es problematisch, wenn es sich nicht um strukturierte Daten handelt. Natürlich kommt "Neshin Excel" nicht in Frage, aber es ist auch nicht gut, die Datenstruktur mit Zeilenumbrüchen, Klammern und anderen Zeichenfolgenregeln in den Tabellenzellen auszudrücken. "Zelle = eine Daten" ist wünschenswert. Sie sollten auch die Eingabe von Leerzeichen beenden, um das Erscheinungsbild anzupassen. Es ist genau die gleiche Geschichte, dass "HTML" nicht verwendet werden sollte, um das Erscheinungsbild von "Tabelle" anzupassen. Wenn Sie diese beiden löschen, ist die Benutzerfreundlichkeit viel besser. Selbst in HTML hat es eine beträchtliche Zeit gedauert, bis das Tabellenlayout gelöscht wurde. Es scheint also, dass dies auch einige Zeit dauern wird. In jedem Fall besteht die aktuelle Situation darin, dass das Erscheinungsbild und die Inhalte integriert und verteilt sind, sodass sich diese in einer Umgebung befinden, die ohne Unterschied leicht zu warten ist. Vielleicht spreche ich von Data Academy.

Das Folgende wird als scheinbarer Feldname extrahiert. Hauptsächlich für Dateien. Es gibt mehr Typen als ich erwartet hatte.

Es scheint ein Schmerz zu sein, sich zusammenzusetzen, während die Notationsschwankung unterdrückt wird. In Kürze mache ich mir Sorgen darüber, wie die Informationen organisiert werden sollen, wenn die aktuelle Liste und die zukünftige Liste (geplant) gleichzeitig veröffentlicht werden. Ich muss geokodieren, um es auf die Karte zu setzen. Ich möchte etwas, das die Lizenz freigegeben hat.

Ich hoffe, dass die Daten schnell und mit einem guten Gefühl verteilt werden.

Abbildung von "5 Sterne offene Daten"

Entgleisungsgeschichte # 1. Wenn Sie mit offenen Daten beginnen, sehen Sie häufig die Zahl offene 5-Sterne-Daten. Um ehrlich zu sein, ich habe es satt. Was im Text geschrieben steht, ist anständig. Es ist in Ordnung, es sorgfältig zu lesen. Das Bild ist jedoch eine Propaganda, dass "LOD das Beste ist". Es ist ein Positionsgespräch, also hab keine Angst.

Wenn Sie daran denken, offene Daten jetzt zu betreiben, während Sie in die Zukunft schauen, sollten Sie sich die Realität ansehen. Ich werde die Eigenschaften von jedem aufschreiben, von dem ich denke, dass ich ihn benutze.

LOD

RDF

CSV

--Kein Kommentar --colspan und rowspan können nicht verwendet werden

Excel

PDF

--Dokumentstruktur geht verloren

Ist Excel derzeit für manuelle Updates nicht sinnvoll? Sie können es beispielsweise mit pandas.read_excel lesen. Es ist cool, die Open Packaging Convention auf Bündelschemata auszudehnen. CSV ist nie immer besser als Excel.

Außerdem sollten Tabellendaten als Tabelle beibehalten werden, solange die Tabelle ordnungsgemäß dargestellt wird. Es ist besser, ** Wartungskosten ** zu betonen. Es gibt einige Dinge, die durch die Verwendung von Triple (Datenverteilung und Repository) erreicht werden können, aber das ist ziemlich einfach zu automatisieren.

HTML-Tabelle ist auch einfach zu bedienen.

Soziales Problem?

Entgleisung # 2. Wenn ich mir Civic Tech anschaue, sehe ich so etwas wie "soziale Probleme lösen" und "Geschäft schaffen". Ich glaube, ich mache selbst Civic Tech, aber beides scheint nicht der Fall zu sein. Während meiner Arbeit als Büroangestellter habe ich das Gefühl, dass ich meine persönlichen Gegenstände zumindest persönlich auf moderne Weise arrangieren möchte.

Tatsächlich ist die Kalender für das Mittagessen derzeit meiner Meinung nach die "unerwartet verwendbare".

Natürlich ist es wichtig, soziale Probleme zu lösen und Unternehmen zu gründen, aber ich hoffe, dass Aktivitäten, die das Leben der Menschen einfach angenehmer machen, als Civic Tech anerkannt werden. Die Pflege der Kindergarten- / Kindergarten-Daten erfolgt auch so, wie "Was wird gelöst?", "Was werden Sie dann tun?" Und "Ist es rentabel?", Aber es ist schwer zu beantworten.

Code for Kobe

Entgleisung # 3. Wir bei Code for Kobe freuen uns auf Ihre Teilnahme. Es besteht keine Teilnahmeberechtigung. Wenn Sie Fragen haben, fragen Sie bitte! → Facebook-Seite

Recommended Posts

Eine Geschichte über Kindergärten, Kindergärten und Kindergärten
Eine Geschichte über Python Pop und Append
Eine Geschichte, die von Go's globalen Variablen und ihrem Umfang abhängig ist
Eine Geschichte über das Ändern von Python und das Hinzufügen von Funktionen
Eine erfrischende Geschichte über Slice in Python
Eine launische Geschichte über Slice in Python
Die Geschichte der Verwendung von Python reduziert
Eine Geschichte, die es aufgegeben hat, JavaScripthon unter Windows auszuführen.
Die Geschichte, einen süßen und schmerzhaften Blick auf benutzerdefinierte Benutzer auf Django zu werfen
Eine Geschichte über die Automatisierung von Online-Mahjong (Jakutama) mit OpenCV und maschinellem Lernen
Die Geschichte, den Versuch aufzugeben, mit Heroku eine Verbindung zu MySQL herzustellen
Eine Geschichte über einen magischen Umbau, der Lubuntu in ein Chromebook bringt
Eine Geschichte, die Slack und Google Spreadsheet verbindet
Eine Geschichte über maschinelles Lernen mit Kyasuket
Eine Geschichte über einen Versuch, uwsgi auf einer fehlgeschlagenen EC2-Instanz zu installieren
Eine Geschichte über das Cross-Kompilieren eines Python-Pakets für AWS Lambda und das Bereitstellen ohne Server
Über _ und __
Eine Geschichte über einfaches maschinelles Lernen mit TensorFlow
Eine Geschichte über den Betrieb einer GCP-Instanz von Discord
Die Geschichte, Artikel-verknüpfte Anzeigen auf Jubatus anzeigen zu wollen
Eine Geschichte über die Implementierung eines Anmeldebildschirms mit Django
Eine Geschichte über das Ausführen von Python auf PHP auf Heroku
Geschichte rund um die Datenanalyse durch maschinelles Lernen