[PYTHON] Un lecteur d'introduction à la théorie de l'apprentissage automatique pour les ingénieurs informatiques a essayé Kaggle

Qu'est-ce que Kaggle

Wikipedia

Kaggle est une plateforme de modélisation prédictive et de méthodes analytiques et sa société d'exploitation où les entreprises et les chercheurs publient des données et les statisticiens et les analystes de données du monde entier se disputent le modèle optimal.

En gros, la version Data Scientist de TopCoder

Contexte

Comme un avant-goût des ingénieurs modernes [Introduction à la théorie de l'apprentissage automatique pour les ingénieurs informatiques](https://www.amazon.co.jp/IT%E3%82%A8%E3%83%B3%E3%82%B8% E3% 83% 8B% E3% 82% A2% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E7% 90% 86% E8% AB% 96% E5% 85% A5% E9% 96% 80-% E4% B8% AD% E4% BA% 95-% E6% J'ai lu 82% A6% E5% 8F% B8 / dp / 4774176982), mais je n'ai pas la possibilité d'utiliser l'apprentissage automatique au travail car je ne travaille pas dans l'analyse de données. Vous ne pouvez pas apprendre l'apprentissage automatique sans réellement bouger vos mains, mais il semble difficile de bouger vos mains car cela nécessite des préparatifs tels que la préparation d'un ensemble de données, donc je ne sais pas ce qui est réellement approprié pour étudier en tant que matériel pédagogique (MNIST?). .. En tant qu'ingénieur moderne, j'aimerais pouvoir utiliser correctement l'apprentissage en ligne et la communauté, et aussi en acquérir des connaissances. J'ai aimé les concours Kaggle de Dataquest, que j'ai essayés en tant que tutoriel.

Objectif dans cet article

Participez au concours de Kaggle Titanic: Machine Learning from Disaster et gagnez votre classement dans le concours.

Getting Start

supposition

J'ai appris la régression logistique et la forêt aléatoire par apprentissage automatique Appliquer du code python environnement d'exécution python

Quoi avoir

Environnement dans lequel le notebook jupyter peut être écrit Compétences en anglais qui ne sont pas si réticentes à lire des sites techniques en anglais

Des choses dont vous n'avez pas besoin cette fois

Environnement GPU Connaissances d'apprentissage en profondeur

Tutoriel sur les compétitions Dataquest Kaggle

Concours Kaggle Un site d'apprentissage en ligne qui sort avec titanic.

Free Kaggle Tutorial - Getting Started with the Titanic Dataset

Si vous avez un compte google ou facebook, vous pouvez démarrer le didacticiel dès que vous vous connectez.

Sur la base des données de survie des passagers du Titanic, un modèle paramétrique qui calcule la probabilité de survie des passagers dans les données de test est créé et les performances du modèle sont mises en concurrence. Le thème est la concurrence de Kaggle. Du prétraitement à la création de modèles, en passant par la formation sur les ensembles de données et les tests de prédiction des ensembles de données, nous continuerons avec le didacticiel tout en résolvant le problème de l'écriture de code python à des points clés.

data_quest_titanic_python.JPG

Cet écran est un exemple de l'écran du tutoriel Dataquest. Un exemple apparaît à gauche, écrivez le code python sur l'écran de droite, appuyez sur le bouton d'exécution, et si le résultat du code est correct, il dira «bon travail» et passera à l'écran suivant.

Le didacticiel prend même en charge la génération d'un fichier qui soumet les résultats de prédiction de l'ensemble de données de test du modèle réellement créé à kaggle. Il existe deux cours Kaggle Competition dans Dataquest, le premier est un modèle de régression logistique simple pour expérimenter le flux, et le prochain cours Improving Your Submission est précis avec un modèle d'apprentissage d'ensemble. C'est un cours qui vise à viser un score en augmentant.

Si vous avez les connaissances écrites dans les locaux, je pense que chaque cours peut être complété en 2 heures.

Après avoir étudié le didacticiel, organisez ce que vous avez appris dans votre environnement d'exécution Python, ... (même si vous copiez et collez simplement le code que vous avez écrit dans le didacticiel), et soumettez le fichier à Kaggle. J'ai essayé de générer le code ici.

Soumettez ceci à Kaggle!

kaggle_titanic_complete.JPG

Il était 1231e dans l'équipe 7071!

Résumé

Vous pouvez en faire l'expérience en peu de temps sans vous en soucier, j'ai donc pensé que ce serait un bon matériel pour l'auto-apprentissage et les sessions d'étude après avoir lu le livre d'introduction sur l'apprentissage automatique. Ceci est une ligne de départ, et même si vous concevez un modèle vous-même, vous pouvez étudier dans le sens d'augmenter un peu plus le score. Je participe également à d'autres compétitions. Dans mon cas, j'étudie l'apprentissage profond, je me réfère donc à divers sites pour la compétition chiens vs chats. J'ai essayé de continuer. Pour le moment, le score était de 0,14160, et le score était d'environ 697e / 1314 équipes, mais il semble que la compétition soit déjà fermée, et si elle est fermée, elle ne sera pas inscrite au Rank, donc c'est un peu décevant. fait.

De côté

L'auteur de Introduction à la théorie de l'apprentissage automatique pour les ingénieurs en informatique avait le même âge que moi et était diplômé de la même faculté des sciences, département de physique (bien que dans une université différente). Je voudrais apprendre le poids des neurones en rétroprojectant le réseau neuronal de mon cerveau avec l'auteur comme données de l'enseignant pour savoir où et où il y a une telle différence. .. ..

Recommended Posts

Un lecteur d'introduction à la théorie de l'apprentissage automatique pour les ingénieurs informatiques a essayé Kaggle
J'ai essayé de comprendre l'apprentissage supervisé de l'apprentissage automatique d'une manière facile à comprendre, même pour les ingénieurs serveurs 1
J'ai essayé de comprendre l'apprentissage supervisé de l'apprentissage automatique d'une manière facile à comprendre, même pour les ingénieurs serveurs 2
[Apprentissage automatique] J'ai essayé de résumer la théorie d'Adaboost
Une introduction à OpenCV pour l'apprentissage automatique
20 sélections recommandées en 2020 de livres d'introduction à l'apprentissage automatique
Une introduction à Python pour l'apprentissage automatique
Une introduction à l'apprentissage automatique pour les développeurs de robots
Apprentissage automatique du sport-Analyse de la J-League à titre d'exemple-②
J'ai essayé de créer un environnement d'apprentissage automatique avec Python (Mac OS X)
Créez un environnement interactif pour l'apprentissage automatique avec Python
[Balisage recommandé dans le machine learning # 2] Extension du script de scraping
[Balisage recommandé dans le machine learning # 2.5] Modification du script de scraping
J'ai essayé de comparer la précision des modèles d'apprentissage automatique en utilisant kaggle comme thème.
Créer un environnement d'apprentissage automatique à l'aide de Python sur MacOSX
[Balisage recommandé avec le machine learning # 1] Scraping d'articles de blog Hatena
Le résultat de l'apprentissage automatique des ingénieurs Java avec Python www
Vérification des performances du prétraitement des données pour l'apprentissage automatique (données numériques) (partie 2)
J'ai essayé d'utiliser Tensorboard, un outil de visualisation pour l'apprentissage automatique
Vérification des performances du prétraitement des données pour l'apprentissage automatique (données numériques) (partie 1)
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Introduction ~
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Implémentation ~
Ensemble de données pour l'apprentissage automatique
Prétraitement japonais pour l'apprentissage automatique
Bases de l'apprentissage automatique (mémoire)
Un débutant en apprentissage automatique a essayé la RBM
Importance des ensembles de données d'apprentissage automatique
Essayez le machine learning à la légère avec Kaggle
[Apprentissage automatique Python] Recommandation d'utilisation de Spyder pour les débutants (à partir d'août 2020)
Résumé des API recommandées pour l'intelligence artificielle, l'apprentissage automatique et l'IA
Comment utiliser l'apprentissage automatique pour le travail? 01_ Comprendre l'objectif de l'apprentissage automatique
[Apprentissage automatique] J'ai essayé de faire quelque chose comme passer des images
J'ai essayé de créer Othello AI avec tensorflow sans comprendre la théorie de l'apprentissage automatique ~ Battle Edition ~