[PYTHON] [Pour les non-programmeurs] Comment marcher Kaggle

Cet article est le troisième jour du calendrier de l'Avent dans Calendrier de l'Avent Kaggle 2019.

J'espère que cela sera utile pour ceux qui pensent que "** Kaggle est intéressé, mais c'est juste et effrayant ... **"!

Jusqu'à ce que je rencontre Kaggle

Mon parcours avant de rencontrer Kaggle est le suivant.

--Marketer ⇒ Consultant --De arts libéraux (majeure en histoire de l'art) --Inexpérimenté en programmation (juste touché HTML)

図13.png

J'étais dans un tel état, mais l'année dernière, j'ai étudié Python et l'apprentissage automatique et j'ai réussi à comprendre Kaggle. Alors, je m'écrirai il y a un an qu'il est bon de le savoir.

Public cible

À qui?

--Je souhaite améliorer mes compétences en analyse de données / apprentissage automatique --Kaggle a l'air amusant, mais inexpérimenté en programmation

quelle?

--Kaggle vaut la peine d'essayer!

Qu'est-ce que "Kaggle"?

Qu'est-ce que Kaggle

En un mot, c'est le Tenkaichi Budokai de l'analyse de données utilisant le «machine learning». image.png

Données à analyser

Période de compétition

――Pendant environ 1 à 3 mois

Classement

--Créez un modèle d'apprentissage automatique et classez-le en fonction du résultat de prédiction du modèle

Prix

――Il y a aussi un concours où des prix seront remis aux meilleurs joueurs --En décembre 2019, le concours DSB actuellement organisé est n ° 1 pour 100000 $ (environ 10 millions de yens!)

Frais d'entrée

Utilisateur enregistré

À propos du rang

Kaggle a 5 rangs en fonction de sa force. (Strictement parlant, vous pouvez obtenir un rang non seulement par votre force dans la compétition mais aussi par votre contribution à la communauté Kaggle telle que les noyaux, les discussions, les ensembles de données)

--Grandmaster * Le plus fort ...!

Il n'est pas exagéré de dire que les personnes qui travaillent sur Kaggle (communément appelé Kaggler) passent beaucoup de temps chaque jour à essayer de rivaliser afin d'élever (probablement) ce rang.

Nombre de personnes par rang

Le nombre de personnes en décembre 2019 est le suivant キャプチャ.PNG

Image de chaque rang

Il s'agit d'un aperçu et d'un diagramme d'image de chaque rang. (C'est juste subjectif) 図1.png

Classer les conditions

Cliquez ici pour les conditions de classement. (En Compétitions) L'expert demande soudainement une médaille. .. .. Si vous êtes un débutant, vous voulez d'abord viser Expert. 図2.png

Conditions d'acquisition des médailles

Il existe trois types de médailles: or, argent et bronze.

Cliquez ici pour les conditions d'acquisition des médailles. (En Compétitions) Les conditions strictes varient selon le nombre de participants, mais ce qui suit est un guide.

図3.png

Par exemple, un tel concours

Prédiction des survivants du naufrage du Titanic

Prédire la vitesse à laquelle les chiens et les chats seront ramassés dans les animaleries

Avantages de faire Kaggle

J'ai énuméré trois avantages de faire Kaggle.

① Comprenez vos propres compétences en science des données (prouvez également)

Les compétences en science des données sont difficiles à mesurer sans pratique. Cependant, gagner des médailles et des grades à Kaggle peut prouver vos compétences approximatives en science des données. Récemment, le nombre d'entreprises qui adoptent Kaggle augmente progressivement, ce qui est également une preuve lors de la montée en puissance. 図4.png

② Apprenez le savoir-faire des data scientists du monde entier (gratuitement!)

Comme je l'ai appris en participant au concours, Kaggle a une merveilleuse culture de partage de savoir-faire et d'informations, pas seulement de concurrence avec les autres. En particulier, "Notebooks" explique le savoir-faire et les tendances de la science des données d'une manière facile à comprendre avec le code, et est recommandé pour les débutants. 図5.png

③ Vous pouvez comprendre ce que fait l'apprentissage automatique au niveau de la peau

De nos jours, l'apprentissage automatique est de plus en plus intégré dans les applications et les outils marketing qui nous entourent. Avec Kaggle, vous pouvez maîtriser le processus de modélisation de l'apprentissage automatique, ce qui vous permet d'avoir une idée de ce que vous pouvez et ne pouvez pas faire avec l'apprentissage automatique. 図6.png

Kaggle devrait commencer ici

Il semble y avoir divers désaccords, mais il y a trois points personnels ci-dessous.

(1) Machine learning / Python Si vous n'avez aucune connaissance, sélectionnez un manuel "Matsuo Lab"!

Laboratoire Matsuo de l'Université de Tokyo, célèbre pour l'apprentissage automatique / IA.

Vous pouvez télécharger gratuitement le texte du "Cours de formation de Data Scientist" organisé par le Laboratoire Matsuo. C'est incroyable, c'est un incident! Le texte et le code Python expliquent soigneusement le niveau d'obtention du diplôme d'apprentissage automatique du débutant, donc si vous avez des difficultés à comprendre le contenu de Kaggle, je pense que vous devriez le compléter.

▼ Cliquez ici pour télécharger le texte "Matsuo Lab" https://weblab.t.u-tokyo.ac.jp/gci_contents/

図8.png

② Utilisez "Cahiers" pour copier ceux qui ont obtenu un nombre élevé de votes et maîtrisez-le!

Comme je l'ai mentionné plus tôt, les «cahiers» de chaque compétition sont un trésor.

Si vous choisissez un concours sur lequel il semble facile de travailler, il est recommandé de copier un cahier avec un nombre élevé de votes dans "Cahiers". Les blocs-notes avec un nombre élevé de votes sont soigneusement sélectionnés et faciles à comprendre, de sorte que vous pouvez revivre le flux de l'acquisition de données à la soumission des résultats du modèle en copiant, et vous pouvez apprendre les astuces de l'apprentissage automatique. 図10.png

③ Si vous êtes seul, vous serez bloqué sans information, il est donc recommandé de vous connecter avec quelqu'un!

Kaggle est une bataille individuelle de base. Cependant, la période de compétition est aussi longue que 1 à 3 mois, et la motivation peut baisser ou s'enliser.

Dans un tel cas, si vous avez des amis qui font Kaggle, vous pouvez partager des informations utiles (le partage privé est NG) et vous encourager mutuellement, et vous pouvez profiter davantage de Kaggle.

Personnellement, je recommande les trois suivants.

--Accédez aux séminaires liés à Kaggle (connpass, etc.) --Suivez Kaggle sur Twitter

図11.png

à la fin

Kaggle est une excellente plate-forme pour les utilisateurs débutants à avancés de l'apprentissage automatique / analyse de données.

Lorsque vous faites Kaggle, vous pouvez rivaliser avec les meilleurs data scientists du monde entier, partager des informations et apprendre. Cependant, quand j'y réfléchis attentivement, je me suis rendu compte que c'était incroyable, et en écrivant cet article, je l'ai réalisé à nouveau.

図12.png

A partir de maintenant, j'aimerais apporter une petite contribution pour garder Kaggle une bonne plateforme! (Tout d'abord, je veux une médaille ...)

Recommended Posts

[Pour les non-programmeurs] Comment marcher Kaggle
Comment vérifier les valeurs manquantes (Kaggle: House Prices)
Comment créer un fichier * .spec pour pyinstaller.
[Python] Organisation de l'utilisation des instructions
Comment installer le sous-système Windows pour Linux
Comment utiliser "deque" pour les données Python
Comment utiliser l'authentification par empreinte digitale pour KDE
Comment utiliser MkDocs pour la première fois
Comment créer un plug-in Spigot (pour les débutants Java)
Comment utiliser Template Engine pour Network Engineer
Comment installer Python pour les chercheurs de sociétés pharmaceutiques
Comment utiliser les outils d'analyse de données pour les débutants
Comment écrire une instruction ShellScript Bash for
[ESXi (vCenter)] Comment ajouter une carte réseau pour CentOS 7.3
Comment rendre le Python des débutants plus rapide [numpy]
[Pour les débutants] Comment étudier la programmation Mémo privé
Comment trouver la corrélation pour les variables catégorielles
Comment forcer TensorFlow 2.3.0 à construire pour CUDA11 + cuDNN8
Comment définir l'affinité du processeur pour les threads de processus
Comment utiliser xml.etree.ElementTree
Comment utiliser Python-shell
[Pour les débutants] Comment utiliser la commande say avec python!
Remarques sur l'utilisation de tf.data
Comment utiliser virtualenv
Grattage 2 Comment gratter
Comment utiliser Seaboan
Comment utiliser la correspondance d'image
Comment utiliser le shogun
Comment convertir le type Python # pour les super débutants de Python: str
Comment installer Python
Comment utiliser Pandas 2
[Pour les débutants] Comment étudier le test d'analyse de données Python3
Comment lire PyPI
Comment installer pip
Comment utiliser Virtualenv
Comment utiliser numpy.vectorize
Comment mettre à jour easy_install
Comment installer Archlinux
Comment exécuter python dans l'espace virtuel (pour MacOS)
Comment utiliser pytest_report_header
Comment redémarrer gunicorn
[Go] Comment créer une erreur personnalisée pour Sentry
Comment installer python
Comment héberger virtuel
Comment déboguer le sélénium
Comment utiliser partiel
Comment utiliser Bio.Phylo
[Introduction à Azure pour les utilisateurs de kaggle] Comparaison du démarrage et de l'utilisation de la machine virtuelle Azure Notebooks et Azure Notebooks
Comment lire JSON
Comment faire un test unitaire Part.2 Conception de classe pour les tests
Comment utiliser SymPy
Comment utiliser x-means
Comment utiliser WikiExtractor.py
Comment mettre à jour Spyder
Comment utiliser IPython
Comment installer BayesOpt
Comment utiliser virtualenv
Comment utiliser Matplotlib