Mémo d'étude ML d'un amateur. Mises à jour irrégulières.
webinar
scikit-learn video #6: Linear regression (plus pandas & seaborn)
http://blog.kaggle.com/2015/05/28/scikit-learn-video-6-linear-regression-plus-pandas-seaborn/
Vous devez vous abonner au blog de kaggle. (Http://blog.kaggle.com/)
A friendly introduction to linear regression (using python)
http://www.dataschool.io/linear-regression-in-python/
Pratique: demande de partage de vélos (kaggle)
https://www.kaggle.com/c/bike-sharing-demand
La date limite étant fermée, je n'obtiendrai pas de classement officiel, mais il sera évalué
Cela semble facile mais pas
Si vous écrivez et soumettez le code facilement, ce sera environ 3000/3200 (nombre total de participants pendant la date limite)
Après avoir regroupé par saison, vacances, jour ouvrable, météo, entraînez-vous chacun et prédisez les données de test en utilisant les résultats d'entraînement du même groupe
Utilisez la température, l'atemp, la vitesse du vent, l'humidité pour apprendre
Explication: https://www.analyticsvidhya.com/blog/2015/06/solution-kaggle-competition-bike-sharing-demand/
Remarque
Comment choisir le taux d'apprentissage: (trop petit: convergence lente) ..., 0,001, 0,003, 0,01, 0,03, 0,1, 0,3, 1, ... (trop grand: la fonction de coût ne devient pas petite ou ne converge pas) → 3 fois chacun
Fonctionnalité Scailing: normalized_value = (original_value --average) / (max --min)
Recommended Posts