[PYTHON] L'élève Kaggler (période de stagnation) qui ne peut pas analyser les données lui-même

introduction

Auto-introduction

Mon nom est Chizuchizu. J'ai 14 ans et je suis 2e. J'ai beaucoup de passe-temps, mais je tapais surtout. (Passé)

Maintenant, je suis un Ikiri Kaggler peu qualifié.

J'ai remporté une médaille de bronze à l'IEEE «provisoire». Je comprendrai plus tard pourquoi c'est «pour le moment».

Après avoir été fatigué d'AtCoder, j'ai commencé Kaggle. Je deviendrai certainement un Maître par moi-même.

La raison pour laquelle j'ai décidé d'écrire

Je voulais écrire un calendrier de l'Avent. Je pensais écrire un article, mais maintenant que je ne suis pas au niveau de l'introduction de la technologie en termes de compétences, j'aimerais transmettre de manière réaliste l'état actuel de la période de stagnation de Kaggle.

Après tout, je pensais que Kaggle était comme un pro de la compétition, mais je l'ai complètement léché. Vous ne pouvez pas vivre sans faire ce que vous faites ...

En résumé, c'est un article que ** Kaggler qui ne peut pas analyser les données s'analyse lui-même ** (chercheur en développement personnel)

Il peut être difficile à lire avec seulement des lettres, mais je serais heureux si vous pouviez le lire. Aussi, donnez-moi quelques conseils bruyants. S'il vous plaît.

Les leçons sont résumées ci-dessous.

Kaggle État actuel de la récession

J'ai pensé qu'il valait mieux écrire d'abord ma situation actuelle que d'écrire le passé et le futur. Je participe à diverses compétitions maintenant, mais je suis dans une crise, donc il y a beaucoup de choses que je ne comprends pas.

Mur de langues

I speak Japanese.I'm not good at English. I'm learning English. I should keep learning a lot:) Ma langue maternelle est le japonais, donc je ne suis pas bon en anglais. (J'essaye d'apprendre un peu en faisant une conversation anglaise en ligne)

Kaggle est tout en anglais. Discussion aussi. Bien sûr, vous pouvez l'écrire en japonais, mais ce sera une discussion entre japonais, il semble donc que vous devriez utiliser l'anglais même si vous utilisez la traduction Google.

Bien sûr, c'est une langue étrangère, donc c'est difficile, mais si vous la lisez correctement, vous comprendrez. (Surtout parce que le notebook a des graphiques et des codes) Je pensais que c'était juste une excuse que je ne pouvais pas faire à cause de la langue.

Si vous ne parlez pas étrangement, vous pouvez répondre à la plupart des questions en anglais au collège. (Normalement sur les problèmes et les discussions GitHub)

Ce n'est pas illisible avec Google Translate, mais je suis encore un peu réticent. Je règle tous mes smartphones en anglais pour pouvoir entrer en contact avec l'anglais au quotidien ... (mais je n'y suis pas encore habitué)

Je ne comprends pas l'essence

Je pense que c'est un problème qui accompagne la barrière de la langue, mais je ne connais pas les caractéristiques des données en premier lieu, donc je ne sais pas quoi analyser, je viens de lire l'EDA et je termine la journée sans le savoir. C'est fermé. Est-il un million d'années avant que vous lisiez le noyau EDA sans comprendre "ce que vous voulez faire"? Je regrette ça.

Combien de fois as-tu triché?

Quand les jours que je ne comprends pas se répètent, je deviens de plus en plus déprimé et je perds ma motivation. A l'époque de la compétition My Navi, j'étais pleine de motivation car je savais quoi faire car j'étais en japonais.

Je suis motivé, mais j'ai l'impression de signaler la plage dans le brouillard, alors je veux abandonner

Je veux lire le livre de Kaggle et chercher un moyen de voir le devant ...

Je ne peux pas être un débutant en programmation de paillettes

Si quoi que ce soit, l'obscurité de l'existence n'est qu'un contributeur.

Il n'y a que des incidents d'obscurité tels qu'un échec de construction qui détruit tout l'environnement et initialise le système d'exploitation, ou un débordement d'échange de mémoire qui remplit un SSD de 1 To et le rend inamorçable.

Quand je regarde la discussion de Kaggle, beaucoup de gens trouvent des fonctionnalités intéressantes, et je suis impressionné de voir à quel point c'est incroyable, mais je me demande combien d'heures j'ai regardé les données à ce moment-là.

Si je peux comprendre l'essence, je pense que c'est celle-ci. Puisque je sais quoi faire, je ferai de plus en plus d'hypothèses, expérimenterai et le prouverai, augmenterai le score, et serai heureux d'augmenter ma vie de façon monotone. Si vous pouvez comprendre l'essence, pouvez-vous devenir un programmeur de paillettes?

L'histoire d'un crash essayant de devenir programmeur de parenthèses

Il s'est écrasé à la suite de la poursuite de l'image idéale. La raison est simple: j'ai perdu de vue l'essence (science des données) parce que je pouvais écrire l'heure dans un endroit qui n'était pas l'essence. Je pensais aussi utiliser Git, mais j'écris du code sur un coup de tête, alors j'oublie de m'engager. Si vous utilisez la classe, il est difficile de vérifier les variables à l'intérieur, donc je l'écrirai autant que possible comme un cahier.

Ce qui s'est passé lors du concours IEEE

Cette compétition a été la première compétition où j'ai remporté une médaille avec Kaggle. Cependant, je ne pouvais pas en être fier car j'ai fini sans rien savoir ... parce que je n'ai pas compris les données et j'ai procédé sans le savoir. Cela a simplement augmenté. Certains peuvent être capables, mais je n'ai pas fait grand-chose et je n'ai rien compris, alors j'ai réalisé que la médaille n'était pas terminée. Pour les raisons ci-dessus, j'ai écrit que j'avais obtenu une médaille «provisoire».

Je veux gagner une médaille majestueuse lors de la prochaine compétition ...

Résumé

Les enfants qui ne peuvent pas lire le manuel sont dans un état. (J'ai acheté ce livre il y a environ un an)

Il est écrit que les personnes qui n'ont pas de capacité de lecture passeront à l'IA, mais s'il n'y a pas de capacité de lecture des personnes qui font de l'IA, cela tombera ...

J'ai pensé qu'il était nécessaire d'améliorer la capacité de lecture des données, ou la capacité de lecture du concours.

Réflexions et leçons apprises

Comprenez le but

Je pensais que c'était probablement la chose la plus importante. Jusqu'à présent, je devais regarder les données et les coder sans connaître le «but», mais cela ne fonctionne pas du tout parce que c'est en quelque sorte. De plus, je ne comprends pas bien la discussion (car je ne comprends pas le but)

Pour le moment, je savais que je devais commencer par comprendre le but et clarifier ce que je devais faire avant de procéder au concours. Je voudrais lire l'aperçu correctement, plutôt que de me précipiter et de faire paresseusement une mystérieuse EDA ou de faire une analyse peu claire. (Cela semble utile pour le noyau de démarrage)

Production (?)

Je ne pense pas que cela s'applique à tout le monde parce que je suis un débutant, mais je pense que je suis probablement celui qui devrait sortir.

Comme je l'ai mentionné plus tôt, je ne peux pas continuer à moins de comprendre le but, mais que faire si j'avais une compréhension ironique? Tu! Qu'est-ce que tu fais! Faux! À moins d'être poignardé (extrêmement), vous ne pourrez pas fonctionner normalement.

Dans certains cas, la sortie peut être évaluée, alors je me suis demandé si cela devait être fait autant que possible dans le cadre du bon sens.

Dans le passé, il y avait un noyau japonais mélangé à l'histoire des Noirs (j'ai écrit le noyau en japonais même si je l'ai écrit en anglais), mais je pense qu'il n'y avait aucune perte à l'écrire.

Ne te décourage pas

C'est une leçon tirée du concours My Navi. En fait, je faisais un peu de solo au début de la compétition My Navi, mais j'ai abandonné car la précision ne s'est pas améliorée du tout, mais je le ferai pour l'équipe après avoir fusionné les équipes! !! !! !! J'ai trouvé de nouvelles découvertes en recherchant et en analysant diverses choses avec des sentiments.

Prenez l'habitude de prendre des notes

J'ai senti que je devais prendre note de tout ce que j'ai fait aujourd'hui (expériences et résultats) sur le Jupyter Notebook et le Slack Single Channel. Au bout de trois jours, j'oublie les humains et je ne me souviens plus de ce que j'ai fait jour après jour lors d'une compétition de deux mois. J'ai pensé que je devrais prendre des notes pour comprendre ce que je devais faire et pour éviter des expérimentations inutiles. (Je ne pense pas qu'il soit nécessaire de l'écrire longtemps)

Les anciens journaux de Slack ont également été utiles lors de la compétition My Navi. Je n'en étais pas vraiment conscient quand j'y participais individuellement, mais je l'ai remarqué quand je travaillais en équipe.

en conclusion

Merci pour la lecture.

En écrivant cet article, je sens que je peux échapper à la crise.

Je ne pense pas que ce soit tout, et après tout, c'est moins que Kaggle Expert, donc c'est peut-être loin d'être la solution optimale. Je me demande si Kaggle Grand Masters peut faire de la science des données comme respirer inconsciemment ... (je ne sais pas parce que c'est quelqu'un d'autre)

Mais j'espère que cet article aide quelqu'un.

Veuillez commenter quoi que ce soit!

Je suis un débutant qui n'a pas encore lu la lettre «D» en science des données, mais j'améliorerai mes compétences petit à petit. C'est une crise, mais Kaggle n'a pas encore abandonné.

Je veux devenir un "vrai" data scientist et pouvoir à nouveau écrire des articles sur Qiita.

Recommended Posts

L'élève Kaggler (période de stagnation) qui ne peut pas analyser les données lui-même
Un graphique sympa pour l'analyse des données de Wiire!