Je suis venu à l'Open Developers Conference à Kamata.
Créons un article en direct tout en écoutant l'histoire.
** 2017/12/21 postscript ** Cliquez ici pour la diapositive d'annonce → https://speakerdeck.com/terapyon/python-ji-jie-xue-xi-kotohazime-at-odc
Prédire les épidémies à partir du nombre de grippes signalées dans la ville de Chiba et de la température
Reçu de la ville de Chiba et de l'Agence météorologique.
Facile si tu viens ici Immédiatement
[Shift] - [Enter] s'exécutera
Pratique
Il peut être publié sur gitub tel quel
Je peux lire le mauvais CSV et le traiter d'une manière ou d'une autre
Exploitez pleinement la fonction de trame de données
Si vous indexez par date, vous pouvez également concaténer des données hebdomadaires et des données quotidiennes avec une seule commande.
Sérialisation
C'est le plus long
Cela ne fonctionne pas si le japonais est inclus
Vous pouvez facilement obtenir un histogramme des pandas en utilisant matplotlib
Pour définir ce qu'est la «mode»
Visualisez les caca multi-variables à la fois avec les pandas Le graphique qui monte tout droit du coin inférieur gauche au coin supérieur droit est la corrélation 1
Et
Variable explicative x
Objectif variable y Populaire 1 Peu populaire 0
Enregistrez les données de test pour éviter le surentraînement. 80% pour l'apprentissage, 20% pour les tests Le ratio dépend du modèle et de la quantité de données
Utilisez scikit-learn
Utilisez une matrice de confusion car c'est presque un succès
Vrai positif Faux positif Vrai négatif Faux négatif
Le ratio d'apprentissage et de test était-il correct? Répétez la division et le recalcul
(Au fait, le temps presse