[PYTHON] Présentation de livres liés à la science des données.

J'ai commencé à étudier les statistiques quand j'étais en troisième année d'université, et cette année est ma quatrième année.

Comme c'est un gros problème, j'ai pensé que ce serait utile pour quelqu'un si je pouvais présenter le livre tout en repensant au type d'étude que j'avais fait. Je pense qu'il y a étonnamment peu d'introduction sur le nombre de livres que vous lisez, à quel niveau et comment vous vous sentiez.

Motivation pour cet article

Ces dernières années, de bons livres sur les statistiques et l'apprentissage automatique sont apparus en japonais et il semble que de nombreuses communautés soient nées. Quand je travaillais, lorsque j'ai interrogé Google Sensei à propos du «travail des statistiques», je n'ai pas obtenu beaucoup d'informations décentes. Je me souviens avoir eu du mal à savoir qu'il semble y avoir un travail de data scientist.

C'était il y a trois ans, vous pouvez donc sentir à quelle vitesse il s'est propagé. Je me souviens avoir entendu le mot «data scientist» quand je travaillais, même si je n'étais pas allé écouter l'histoire dans ce but.

S'adressant aux étudiants à la recherche d'un emploi, il semble que cet élan n'a pas encore diminué et les entreprises sont toujours à la recherche de personnes fortes en analyse de données. Il semble qu'il existe de nombreux bons livres écrits en japonais, en partie parce qu'ils sont très populaires dans la société.

D'un autre côté, je pense qu'il y a aussi l'aspect qu'il est difficile de choisir quel livre lire car il y a trop de bons livres.

Alors, cette fois, je voudrais vous présenter les livres que je lis de temps en temps tout en revenant sur la trajectoire de mon étude en statistique. L'image du livre est un lien vers Amazon, donc je pense que les critiques qui y sont écrites seront également utiles. Ici, j'aimerais écrire quelque chose qui n'est pas écrit dans la critique d'Amazon autant que possible.

Pourquoi avez-vous commencé à étudier les statistiques en premier lieu?

La motivation pour commencer à étudier est étonnamment intéressante pour chaque personne.

Dans mon cas, quand j'ai simplement appris les statistiques en classe, j'ai pensé que c'était "intéressant".

Ce qui était intéressant était ** test **. Pendant longtemps, je me suis demandé: «Quand je mesure quelque chose et que je le compare, combien est-il identique et où est-ce différent? Par exemple, lorsque vous mesurez votre taille et que vous parlez d'être plus grand et plus petit que vos amis, la différence de 0,1 mm est-elle la même? Alors qu'en est-il de 1 mm? On dit que la différence de 1 mm est la même, mais la différence de 1,1 mm n'est-elle pas la même? C'est une question que les gens pourraient détester.

Je pense qu'il n'y a rien de mal à laisser les sentiments de l'autre tant qu'ils vivent normalement, mais que dois-je faire si je veux évaluer objectivement? Je réfléchis depuis longtemps. Je ne savais pas quoi chercher à Guguru, et je n'ai pas demandé parce que les gens semblaient ne pas l'aimer, alors je suis soudainement apparue en classe. Je me souviens avoir été un peu impressionné.

J'ai donc commencé à étudier les statistiques parce que je voulais savoir pour quelle raison la différence était évaluée.

Échec au début

Depuis que je suis du département d'ingénierie des systèmes de gestion, j'ai abordé dans une certaine mesure les statistiques en classe, comme le contrôle de la qualité. En termes de niveau, j'ai senti que je pouvais comprendre le niveau 2 du test statistique.

À partir de ce niveau, je ne savais pas trop quoi étudier, donc la première chose que j'ai commencé a été d'étudier dans la gamme du test statistique de niveau 1. La raison était simple, la plus large gamme, les mots comme ça, et il me semblait que je pouvais obtenir des connaissances complètes.

Pour être honnête, je pense que cela a été un échec en termes d'amélioration de mes capacités.

Malgré sa large gamme, il n'y a pas de manuel pour cela, j'ai donc dû lire un manuel pour étudier un domaine. C'est une tâche de sauter la preuve et de prendre dans le contour. Alors qu'il était difficile de gagner du temps en raison de la montagne d'expériences et de tâches scolaires, j'ai essayé de saisir l'ensemble pendant que le moyamoya était sur le point d'exploser.

Parce que je faisais une telle chose, je ne pouvais acquérir que la connaissance superficielle d'une flaque d'eau ...

J'ai fait une erreur, alors j'ai pensé que je devais la comprendre correctement, alors j'ai décidé de commencer à étudier pour pouvoir acquérir régulièrement mes capacités.

D'abord d'ici (1ère année)

Bien que cela ait échoué, il y a eu une récolte. Tout d'abord, il semble que vous ne pourrez même pas l'utiliser à moins de poser les pieds sur terre et d'étudier. De plus, comme prémisse majeure, il s'est avéré que les statistiques nécessitent une connaissance de la distribution de probabilité. Et j'en manquais cruellement. C'est pourquoi j'ai commencé ce livre.

1. Probabilité / statistiques des étudiants universitaires

[Statistiques de probabilité des étudiants universitaires.jpg](https://www.amazon.co.jp/%E5%BC%B1%E7%82%B9%E5%85%8B%E6%9C%8D%E5%A4%A7%E5%AD%A6% E7% 94% 9F% E3% 81% AE% E7% A2% BA% E7% 8E% 87% E3% 83% BB% E7% B5% B1% E8% A8% 88-% E8% 97% A4% E7 % 94% B0-% E5% B2% B3% E5% BD% A6 / dp / 4489020694)

C'était une excellente réponse de choisir ce livre.

La bonne chose à propos de ce livre est que vous pouvez acquérir des connaissances grâce à des exercices tout en étudiant pour les examens.

En plus de la connaissance des distributions de probabilité de base, vous pouvez également apprendre à utiliser les qualifications de pôle central et les fonctions de population de facteurs de produit, la conversion de variables des distributions multidimensionnelles et le calcul des valeurs attendues conditionnelles. Vous pouvez également pratiquer les bases des processus stochastiques tels que la chaîne de Markov et le processus de Poisson.

Vous pouvez apprendre ces contenus grâce à des calculs manuels. À moins que vous n'alliez dans un livre ésotérique, je pense que vous serez en mesure d'acquérir suffisamment de connaissances sans étudier les probabilités pendant un certain temps. Je suis très reconnaissant de pouvoir acquérir des techniques de calcul de base qui sont couramment utilisées dans les ouvrages de référence statistique, etc., ou qui sont trop courantes et brisées.

En passant, le dernier chapitre porte sur l'actuariat de l'assurance, mais je pense que vous n'êtes pas obligé de le faire ici.

2. Statistiques des sciences naturelles

[Statistiques des sciences naturelles.jpg ](Https://www.amazon.co.jp/%E8%87%AA%E7%84%B6%E7%A7%91%E5%AD%A6%E3%81%AE%E7%B5%B1 % E8% A8% 88% E5% AD% A6-% E5% 9F% BA% E7% A4% 8E% E7% B5% B1% E8% A8% 88% E5% AD% A6-% E6% 9D% B1 % E4% BA% AC% E5% A4% A7% E5% AD% A6% E6% 95% 99% E9% A4% 8A% E5% AD% A6% E9% 83% A8% E7% B5% B1% E8 % A8% 88% E5% AD% A6% E6% 95% 99% E5% AE% A4 / dp / 4130420674)

Maintenant que j'ai la connaissance des probabilités de base, j'ai choisi ce livre pour étudier les statistiques.

C'est un soi-disant livre bleu, mais de nombreuses personnes ** [livre rouge](https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E5%AD%A6% E5% 85% A5% E9% 96% 80-% E5% 9F% BA% E7% A4% 8E% E7% B5% B1% E8% A8% 88% E5% AD% A6% E2% 85% A0-% E6% 9D% B1% E4% BA% AC% E5% A4% A7% E5% AD% A6% E6% 95% 99% E9% A4% 8A% E5% AD% A6% E9% 83% A8% E7% B5% B1% E8% A8% 88% E5% AD% A6% E6% 95% 99% E5% AE% A4 / dp / 4130420658 / ref = asc_df_4130420658 /? Tag = jpgo-22 & linkCode = df0 & hvadid = 2956etw68542764 & hvpos = & hvn = gvn = g = 5071693128671812832 & hvpone = & hvptwo = & hvqmt = & hvdev = c & hvdvcmdl = & hvlocint = / hvlocphy = 100009255 & hvtargid = pla-524368023110 & psc = 1 & th = 1 & psc = 1) ** Quand je me demandais si je devais faire un livre rouge, je pensais que je ne souffrirais pas beaucoup du livre avec la probabilité que j'ai soulevée plus tôt et le contenu que j'ai fait en classe, alors je l'ai sauté, mais cela ressemble à un bon livre, donc c'est bien de le faire Je pense.

Bien sûr, choisir Aomoto était également la bonne réponse. Tout d'abord, c'était bien d'avoir une certaine connaissance des modèles linéaires. Dans l'introduction à l'apprentissage automatique, la distribution des erreurs ne faisait pas partie du test, il était donc intéressant de pouvoir étudier ici.

De plus, bien que le niveau de l'histoire du test ne soit pas trop élevé, il a été écrit relativement bien, ce fut donc une excellente expérience d'apprentissage. J'aime le flux de la méthode la plus probable au test. Si vous avez une question telle que "Il y a un test XX, pourquoi ce test est-il bon?", Cela peut être décevant.

D'ailleurs, en étudiant ce livre, j'ai réalisé l'importance de la connaissance de l'algèbre linéaire, donc j'ai également revu l'algèbre linéaire.

Analyse multivariée du noyau

Analyse multivariée du noyau.jpg

J'ai entendu dire que SVM est incroyable, alors quand j'ai demandé à mon professeur, j'ai recommandé ce livre.

À cette époque, je n'avais pas le concept d'espace en mathématiques en premier lieu, donc j'étais confus parce que divers espaces tels que l'espace des fonctionnalités, l'espace d'échantillonnage et l'espace nucléaire de Hilbert régénératif sont sortis. Je me souviens de l'avoir fait. De plus, au lycée et en première année au collège, je pense que vous apprenez souvent des propriétés qui sont généralement valables, mais pour des choses qui ont de telles propriétés, des choses rudimentaires Je me souviens que je trébuchais souvent.

Je pense que c'est un peu difficile si vous n'avez pas un certain niveau de mathématiques, mais je pense que le contenu du livre est assez facile à comprendre. La lecture de ce livre à ce stade n'est pas recommandée à ce niveau, mais elle est recommandée à tous ceux qui veulent en savoir un jour sur les méthodes du noyau.

Méthode d'analyse statistique multivariée

[Méthode d'analyse statistique multivariée.jpg ](Https://www.amazon.co.jp/%E5%A4%9A%E5%A4%89%E9%87%8F%E7%B5%B1%E8%A8%88%E8%A7%A3 % E6% 9E% 90% E6% B3% 95-% E7% 94% B0% E4% B8% AD-% E8% B1% 8A / dp / 476870154X / ref = sr_1_1? __Mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & keywords =% E5% A4% 9A% E5% A4% 89% E9% 87% 8F% E7% B5% B1% E8% A8% 88 % E8% A7% A3% E6% 9E% 90% E6% B3% 95 & qid = 1605949253 & sr = 8-1)

C'est un livre assez ancien (livre de 1983), mais je l'aime beaucoup. Vous pouvez en apprendre davantage sur les méthodes d'analyse multivariée de base (analyse de régression, analyse en composantes principales, analyse discriminante, méthode de quantification, analyse factorielle, méthode d'analyse graphique, analyse de cluster). L'introduction est partie de l'histoire de la motivation pour expliquer des exemples concrets et ce que vous voulez savoir en utilisant ces données, au lieu du flux habituel d'expliquer la théorie dans son ensemble, puis des exemples concrets, puis la théorie et les données concrètes. Étant donné que les calculs ci-dessus se déroulent en parallèle, vous pouvez étudier avec le même sentiment que lorsque vous analysez réellement les données.

En y regardant maintenant, je pense que le discours et les calculs sont trop spécifiques, mais j'étais très reconnaissant pour la spécificité à ce moment-là.

Outre l'analyse multivariée, "[Analyse des données réelles](https://www.amazon.co.jp/%E3%83%87%E3%83%BC%E3%82%BF%E8%A7%" A3% E6% 9E% 90% E3% 81% AE% E5% AE% 9F% E9% 9A% 9B% E2% 80% 95% E5% A4% 9A% E6% AC% A1% E5% 85% 83% E5% B0% BA% E5% BA% A6% E6% B3% 95% E3% 83% BB% E5% 9B% A0% E5% AD% 90% E5% 88% 86% E6% 9E% 90% E3% 83% BB% E5% 9B% 9E% E5% B8% B0% E5% 88% 86% E6% 9E% 90-% E5% A5% A5-% E5% 96% 9C% E6% AD% A3 / dp / 4863451814 / ref = sr_1_2? __ mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & keywords =% E3% 83% 87% E3% 83% BC% E3% 82% BF% E8% A7% A3% E6% 9E% 90% E3% 81% AE% E5% AE% 9F% E9% 9A% 9B & qid = 1605949876 & sr = 8-2) », mais c'est aussi la première fois Recommandé pour les universitaires. Je ne connais pas grand-chose aux livres traitant de la mise à l'échelle multidimensionnelle, donc je pense que c'est utile.

Résumé de la 1ère année

Au cours de la première année, j'ai commis une erreur et y ai réfléchi, en me concentrant sur les connaissances de base en probabilités, les idées statistiques et en étudiant des méthodes utilisables telles que l'analyse multivariée. J'avais entendu le terme «théorie de la mesure», mais je pense que c'était la bonne réponse que je n'y ai pas touché parce que je pensais que c'était impossible au niveau.

Aussi, je me suis rendu compte que la connaissance de l'algèbre linéaire et de l'intégration mineure que j'avais apprise lors de ma première année à l'université était importante, et c'était bien de pouvoir la revoir sans avoir à la porter de côté. Je pense que l'important dans les études est de continuer, donc je suis heureux d'avoir pu acquérir la force physique pour continuer à étudier dans ce sens puisque je suis en vie depuis.

Introduction à l'apprentissage automatique (2ème année)

Au cours de ma deuxième année, j'étais en quatrième année d'université et j'ai été affecté au Laboratoire de statistiques appliquées. Je n'avais pas prévu d'aller aux études supérieures pour des raisons financières, alors j'ai pensé que les études continueraient d'être utiles même après avoir trouvé un emploi. Alors, quand j'ai demandé à l'enseignant: «Je veux étudier plus que de la recherche, est-ce que ça va?» Au moment de choisir un laboratoire, il était heureux de l'accepter. (Après avoir fait la recherche, j'ai trouvé que cette idée était fausse et que ce que j'ai gagné de la recherche continuerait d'être utile, mais je suis reconnaissant à l'enseignant qui a osé accepter sans entrer dans le vif du sujet.)

J'ai entendu dire que l'IA semble s'appeler l'apprentissage automatique, j'ai donc décidé d'étudier d'abord l'apprentissage automatique.

Bases de l'apprentissage statistique

[Bases de l'apprentissage statistique.jpg ](Https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E7%9A%84%E5%AD%A6%E7%BF%92%E3%81%AE % E5% 9F% BA% E7% A4% 8E-% E2% 80% 95% E3% 83% 87% E3% 83% BC% E3% 82% BF% E3% 83% 9E% E3% 82% A4% E3% 83% 8B% E3% 83% B3% E3% 82% B0% E3% 83% BB% E6% 8E% A8% E8% AB% 96% E3% 83% BB% E4% BA% 88% E6% B8% AC% E2% 80% 95-Trevor-Hastie / dp / 432012362X)

C'est ce livre qui a été présenté après avoir demandé à l'enseignant des recommandations pour étudier l'apprentissage automatique.

C'est un livre très apprécié car il traite de manière exhaustive des méthodes de base de l'apprentissage automatique et explique en détail le contexte théorique avec des idées statistiques. Je l'utilise encore souvent comme dictionnaire.

Comme il est épais, les connexions et les comparaisons de chaque méthode sont détaillées. Personnellement, j'aime le flux de l'ensachage aux forêts aléatoires et l'évolution des polynômes segmentaires aux splines.

Il existe peu de livres qui couvrent un large éventail de sujets tels que l'apprentissage non supervisé et la régularisation, il est donc également recommandé de les couvrir. De plus, je ne connais que ce livre, qui contient les bases des histoires stimulantes qui sont populaires dans kaggle, donc je recommande ce point également. (Depuis que j'ai écrit un article qui vient de remplir l'espace entre les lignes pour booster, je ne publierai que ** lien **.)

C'était très lourd (à bien des égards), en particulier il était très difficile de remplir l'interligne de la transformation de formule, et quand j'ai essayé de remplir l'interligne et de l'apporter à l'enseignant, "L'espacement des lignes est rempli, mais je ne comprends pas. J'ai beaucoup de souvenirs, comme on me dit de revenir.

Il y a tellement de références, et elles sont introduites avec l'explication qu'il s'agit de tels documents, alors j'ai aussi lu celles que je n'ai pas comprises. Seuls les bons articles sont présentés ici, c'était donc une bonne pratique de lire les articles avant d'entrer à l'école doctorale.

Concept de modèle probabiliste

Bases du modèle probabiliste.jpg

Je n'ai pas tout lu, je n'ai lu que la partie du processus stochastique.

Je pense que c'était un livre relativement facile à comprendre, mais je n'ai pas eu l'occasion d'utiliser le processus stochastique par la suite, donc je ne m'en souviens pas beaucoup. .. .. Je me souviens avoir eu l'impression d'avoir pu comprendre l'histoire de base du processus stochastique.

Statistiques fiables: comment traiter les valeurs aberrantes

![Comment gérer les statistiques hors limites.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/296113/49d3b28e-075f-6771-3025- f76f172969d1.jpeg)

Le thème de ma recherche de fin d'études était des statistiques robustes, j'ai donc étudié pour la première fois dans ce livre. Je pense plutôt qu'il n'y a probablement que ce livre japonais sur les statistiques robustes. (L'autre chose que je sais est "[Estimation par régression obstinée (Minotani)]] (https://www.amazon.co.jp/%E9%A0%91%E5%81%A5%E5%9B%9E%E5%B8%B0%E6%8E%A8%E5%AE%9A- % E7% B5% B1% E8% A8% 88% E3% 83% A9% E3% 82% A4% E3% 83% 96% E3% 83% A9% E3% 83% AA% E3% 83% BC-% E8% 93% 91% E8% B0% B7-% E5% 8D% 83% E5% 87% B0% E5% BD% A6 / dp / 4254128371) ». )

Ce livre du professeur Fujisawa est incroyablement facile à comprendre et fortement recommandé. Je me souviens avoir senti que Dieu était là parce que c'était facile à comprendre même s'il n'y avait qu'un seul livre que je pouvais lire en japonais.

Bien qu'il s'agisse d'un livre étranger, l'autre chose que j'ai lue sur Robust Statistics est "Statistiques robustes: théorie et méthodes (Maronna, Martin, Yohai) / hatena-blog-22 /) »et« [Statistiques robustes (Huber, Ronchetti)](https://www.amazon.co.jp/Robust-Statistics-Wiley-Probability/dp/0470129905/ref=pd_sbs_14_2/356 -3755802 à 2.699.304? _encoding = UTF8 & pd_rd_i = 0470129905 & pd_rd_r = 33c41826-0716-411d-9320-aa56f2cbbeba & pd_rd_w = K1XTl & pd_rd_wg = g7OpW & pf_rd_p = c295905f-82f9-4d73-8142-c393a4211258 & pf_rd_r = 7CFK72Z048WTV0C0HVYJ & psc = 1 & refRID = 7CFK72Z048WTV0C0HVYJ) « est je suppose. Après cela, j'ai eu l'impression d'avoir attrapé beaucoup de papiers. J'ai eu quelques réflexions sur des statistiques robustes, mais je vais omettre cette histoire car elle sera longue.

Bases de la statistique mathématique

[Bases des statistiques mathématiques.jpg ](Https://www.amazon.co.jp/%E6%95%B0%E7%90%86%E7%B5%B1%E8%A8%88%E5%AD%A6%E3%81%AE % E5% 9F% BA% E7% A4% 8E-% E9% 87% 8E% E7% 94% B0-% E4% B8% 80% E9% 9B% 84 / dp / 4320014529 / ref = sr_1_5? __ mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & mots-clés =% E6% 95% B0% E7% 90% 86% E7% B5% B1% E8% A8% 88 % E5% AD% A6% E3% 81% AE% E5% 9F% BA% E7% A4% 8E & qid = 1605955749 & s = livres & sr = 1-5)

Acheté avec le désir d'acquérir des connaissances statistiques de base grâce à la recherche de fin d'études. Le contenu n'est pas léger, mais je suis heureux d'avoir acquis une connaissance approfondie des statistiques. De tous les livres sur les statistiques mathématiques, c'est mon livre préféré jusqu'à présent.

En termes de contenu, l'histoire de la probabilité est simple et détaille les modèles statistiques, la convergence, les tests et l'estimation. Je pense que l'histoire générale des statistiques mathématiques a été écrite. Je pense que l'expression "un livre d'introduction à part entière" convient parfaitement.

Si l'espace entre les lignes n'est pas rempli, vous devriez vous référer à "Théorie de l'optimisation des points". Je pense. Bien que ce soit en anglais, je l'ai aimé car l'explication et le style d'écriture étaient faciles à comprendre. En particulier, je pense que la partie de la théorie apocalyptique a été écrite de manière assez détaillée. Je veux tout lire un jour, mais je ne pense pas que je le ferai. .. ..

(À propos, la théorie de l'optimisation des points a été recommandée par l'enseignant, ou cette critique de livre (lien direct pdf) Je pense que je l'ai lu et jeté un coup d'œil. Il vaut la peine d'être lu car il a été examiné en détail.)

(Pour la théorie de l'optimisation des points, je pense que le PDF était sur le net.)

Je lisais aussi le journal

J'ai écrit sur les bases de l'apprentissage statistique, mais j'ai lu pas mal d'articles. Je n'ai pas dit que je lisais beaucoup, mais j'ai pensé qu'il serait utile d'écrire que j'ai lu les livres après cela quand j'aurais atteint ce niveau. .. ..

Pour en revenir à l'histoire, les articles mentionnés dans les références sur la base de l'apprentissage statistique étaient heureusement faciles à lire, c'était donc une bonne pratique. Dans un premier temps, je lis les articles qui sont repris comme références dans les livres, etc., puis je suis à nouveau les références écrites, et il est intéressant d'approfondir ma compréhension des idées qui ont conduit à chaque méthode et théorie, les problèmes qui ont été résolus, etc. C'était. C'était également bien d'avoir pu connaître la propagation et la connexion en lisant les articles énumérés dans les références des articles.

Les articles que j'ai lus pour mes recherches de fin d'études n'étaient pas toujours faciles à lire, mais je ne savais pas que je devais tous les lire, et j'avais une certaine tolérance, donc c'était beaucoup. Inutile de dire que le professeur m'a beaucoup aidé, mais je pense que c'était formidable d'avoir pu lire la thèse relativement sans stress après avoir obtenu mon diplôme de premier cycle.

Résumé de la deuxième année

J'ai terminé ma deuxième année d'étude comme ça. En gros, il semble que la première moitié étudiait l'apprentissage automatique, et la seconde moitié étudiait des statistiques robustes et des statistiques mathématiques grâce à la recherche de fin d'études. Au fait, j'ai utilisé MATLAB à l'école doctorale. J'aime vraiment ça.

La croissance de l'année écoulée a été énorme, et lorsque j'étudiais pour la première année, j'ai pu me renforcer au-delà de mon imagination.

Ce n'est pas à cause de mes propres efforts, mais à cause des professeurs du laboratoire. C'était formidable qu'il m'ait éduqué correctement pour que je puisse le comprendre. Je parlerai des détails à une autre occasion, mais j'ai senti que ce genre de chose s'appelait l'éducation. En plus de l'orientation académique, j'ai également reçu une formation sur les idées et attitudes de base nécessaires en tant que personne ou en tant que membre de la société. C'est un énorme avantage à travailler. (D'une manière ou d'une autre, le sentiment de dire "j'ai été éduqué" n'est pas très bon, mais l'orientation et la formation ne suffisent pas en termes de mots, et l'éducation est le mot parfait.)

Je suis devenu membre de la société (3e année)

Ma troisième année était ma première année en tant que membre de la société, et j'ai commencé à travailler en tant que data scientist. Je ne suis pas un ingénieur en apprentissage automatique, mais un data scientist du côté commercial, et j'ai beaucoup de travail de conseil. Le premier travail que j'ai fait était le conseil en marketing. Quand j'étais étudiant, je me concentrais sur les applications en classe (je parlais d'applications parce que c'était de l'ingénierie de gestion), et dans ma propre étude je me suis concentré sur parler de théorie, mais même lorsque je suis devenu membre de la société, cet équilibre J'ai étudié avec la conscience que je voulais maintenir.

Au travail, j'ai dû travailler dur pour acquérir des connaissances de domaine plutôt que des statistiques, et l'étude des statistiques est devenue modeste. C'était un peu décevant, mais je pense que ce serait bénéfique si je pouvais continuer ce travail.

Reconnaissance de formes et apprentissage automatique (communément appelé PRML)

[PRML.jpg](https: //www.amazon.co.jp/%E3%83%91%E3%82%BF%E3%83%BC%E3%83%B3%E8%AA%8D%E8%AD%98%E3%81 % A8% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92-% E4% B8% 8A-CM-% E3% 83% 93% E3% 82% B7% E3 % 83% A7% E3% 83% 83% E3% 83% 97 / dp / 4621061224) ![PRML below.jpg](https: //qiita-image-store.s3.ap-northeast-1.amazonaws. com / 0/296113 / 4c68e87f-4c0e-57b9-7193-fe43033127b7.jpeg)

Après avoir lu les bases de l'apprentissage statistique, j'ai lu PRML, qui est un autre livre à lire absolument. Cela ressemblait à Bay Bay Bays et il était difficile de suivre la transformation de la formule. Cependant, je pense que c'est un livre célèbre, et si vous le recherchez en ligne, vous trouverez de nombreux sites, blogs et diapositives utiles. J'ai eu du mal parce que les bases de l'apprentissage statistique sont petites, mais PRML était facile à étudier à cet égard.

Surtout cette page est recommandée. Le PDF est distribué gratuitement, mais j'en ai acheté la version papier. Je suis très reconnaissant pour ce contenu pour 556 yens. Dieu sérieux.

Personnellement, je préfère les bases de l'apprentissage statistique au PRML.

Comme pour les bases de l'apprentissage statistique, je pense que la chose importante lorsque l'on étudie comme ça est de bouger les mains honnêtement. Bien sûr, c'est mon niveau, donc je ne connais pas le sentiment de quelqu'un de plus fort que moi, mais ...

Analyse de texte

[Text Analytics.jpg](https //www.amazon.co.jp/%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%A2%E3%83%8A%E3% 83% AA% E3% 83% 86% E3% 82% A3% E3% 82% AF% E3% 82% B9-% E7% B5% B1% E8% A8% 88% E5% AD% A6One-Point-% E9% 87% 91-% E6% 98% 8E% E5% 93% B2 / dp / 432011261X / ref = sr_1_1? __Mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & mots-clés =% E3% 83% 86% E3% 82% AD% E3% 82% B9% E3% 83% 88% E3% 82% A2% E3% 83% 8A% E3% 83% AA% E3 % 83% 86% E3% 82% A3% E3% 82% AF% E3% 82% B9 & qid = 1606048673 & s = livres-anglais & sr = 1-1)

Je l'ai acheté parce qu'il me semblait que je traitais souvent de données textuelles au travail. Le contenu en lui-même était bon, mais pour être honnête, ce n'était pas ce à quoi je m'attendais. Mais le contenu était bon.

Plutôt que d'être poli sur chaque méthode, j'ai pu avoir une vue d'ensemble de la façon dont une telle approche existe pour analyser les données textuelles.

Traitement des données manquantes

Traitement des données manquantes.jpg

En pratique (mais pas ainsi), c'est une parade de données manquantes. Naturellement, vous devez savoir comment gérer les données manquantes. Alors j'ai pris ce livre.

Fondamentalement, ce livre se concentre sur la méthode d'affectation multiple, et j'ai été satisfait du contenu car il traite de la méthode d'affectation multiple dans diverses méthodes, mais le dernier chapitre "Conclusion" était très bon.

En outre, par exemple, dans le chapitre sur la méthode d'assignation multiple dans la régression logistique, l'explication de la régression logistique elle-même (pourquoi la régression logistique est utilisée) était également très bonne.

Apprentissage profond à partir de zéro

Deep Learning.jpg fait à partir de zéro

Quand je suis dans ce genre de travail, on me dit quelque chose comme "Vous comprenez le Deep Learning", mais j'ai honte de dire que cela ne m'intéressait pas beaucoup et que je n'ai pas étudié jusqu'à présent. Mais je pensais que ce n'était pas bon de continuer à dire que je ne savais pas du tout, alors j'ai décidé d'étudier avec ce livre pour le moment.

Je pense que c'est une excellente introduction pour voir comment cela fonctionne à l'intérieur.

Ingénierie de fonctionnalités pour l'apprentissage automatique

[![Ingénierie de la quantité de fonctionnalités pour l'apprentissage automatique.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/296113/17cbecdf-c49d-c9e9-f1d9-346f944c6797] .jpeg)](https://www.amazon.co.jp/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%AE%E3% 81% 9F% E3% 82% 81% E3% 81% AE% E7% 89% B9% E5% BE% B4% E9% 87% 8F% E3% 82% A8% E3% 83% B3% E3% 82% B8% E3% 83% 8B% E3% 82% A2% E3% 83% AA% E3% 83% B3% E3% 82% B0-% E2% 80% 95% E3% 81% 9D% E3% 81% AE % E5% 8E% 9F% E7% 90% 86% E3% 81% A8Python% E3% 81% AB% E3% 82% 88% E3% 82% 8B% E5% AE% 9F% E8% B7% B5-% E3% 82% AA% E3% 83% A9% E3% 82% A4% E3% 83% AA% E3% 83% BC% E3% 83% BB% E3% 82% B8% E3% 83% A3% E3% 83% 91% E3% 83% B3-Alice-Zheng / dp / 4873118689 / ref = sr_1_1? __ mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & crid = L0BJ87AUAYC7 & dchild = 1 & mots-clés =% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E7% 89% B9% E5% BE% B4% E9% 87% 8F% E3% 82% A8% E3% 83% B3% E3% 82% B8% E3% 83% 8B% E3% 82% A2% E3% 83% AA% E3% 83% B3% E3% 82% B0 & qid = 1606052771 & sprefix =% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 81% AE % 2Caps% 2C364 & sr = 8-1)

Jusque-là, pour autant que je sache, je faisais des fonctionnalités à partir de quelques options. J'ai pris ce livre parce que je pensais que ce n'était pas très bon.

En termes de contenu, il semble que la méthode principale consiste à créer des quantités de caractéristiques.

Pour être honnête, je ne savais pas grand-chose à ce sujet, mais c'était super de lire ce qui était organisé dans un seul livre parce que je pouvais l'organiser dans mon esprit. Aussi, lorsque j'étudiais l'analyse des données textuelles, j'ai eu l'impression que ce que je voulais savoir était plutôt écrit dans ce livre.

Ce livre est encore souvent utilisé lors de l'analyse.

Recherche causale statistique

Recherche causale statistique.jpg

Je pense que beaucoup de gens aimeraient étudier le raisonnement causal statistique. Je pensais que oui, et quand j'ai regardé différents livres, cela semblait être bon.

À partir de l'histoire de base du raisonnement causal statistique, le flux est d'expliquer la méthode appelée LiNGAM conçue par l'auteur. L'explication était facile à comprendre et j'ai pu la lire avec un sentiment agréable, tel que «je voulais ce genre d'explication». Je le recommande fortement.

Malheureusement, dans la pratique, on ne nous demande pas souvent une analyse appropriée, mais j'espère qu'un jour nous reconnaîtrons son importance. (Mais il serait difficile d'expliquer cela à des non-analystes ...)

Méthode de planification des expériences d'introduction

[Méthode de planification expérimentale.jpg]( https://www.amazon.co.jp/%E5%85%A5%E9%96%80-%E5%AE%9F%E9%A8%93%E8%A8%88%E7%94%BB% E6% B3% 95-% E6% B0% B8% E7% 94% B0-% E9% 9D% 96 / dp / 4817103825 / ref = sr_1_10? adgrpid = 57126337881 & dchild = 1 & gclid = CjwKCAiAtej9BRAvEiwA0UAWXuhZeHtM8mwrwcLEZPJZ6HM__Qd0oo_KlQ9F77IAn2aoow5vJnWEZhoCwUEQAvD_BwE & hvadid = 338530619916 & hvdev = c & hvlocphy = 1009255 & hvnetw = g & hvqmt = b & hvrand = 18019147825820991363 & hvtargid = aud-990383411460% 3Akwd-302343910705 & hydadcr = 27706_11559583 & jp-ad-ap = 0 & mots-clés =% E5% AE% 9F% E9% A8% 93% E8% A8% 88% E9% A8% 93% E8% A8% 88% % E5% 88% 86% E6% 95% A3% E5% 88% 86% E6% 9E% 90% E3% 81% AE% E3% 81% AF% E3% 81% AA% E3% 81% 97 & qid = 1606055140 & sr = 8-10 & tag = googhydr-22)

Il s'agit d'un livre du professeur Nagata, qui a remporté le prix Deming l'année dernière.

Je voulais étudier la méthode de planification expérimentale pendant longtemps car l'analyse correcte des données commence par l'acquisition des données correctes, mais j'ai pensé que ce serait un peu gênant et je l'ai laissé tranquille. .. .. Depuis que je suis devenu membre de la société, il est devenu difficile de prendre le temps d'étudier comme je le faisais quand j'étais étudiant, donc même si je le lisais légèrement (sans bouger les mains fermement et réfléchir longtemps), je pense que je peux le comprendre. La méthode de planification expérimentale était plutôt parfaite. C'est assez intéressant à étudier. Eh bien, quand vous y pensez, cela dit quelque chose de naturel, mais si vous ne le savez pas, vous le manquez.

Il comprend également des histoires sur la façon d'étudier et les liens avec chaque domaine, et je pense que c'est une structure très gentille pour ceux qui étudient seuls. Le développement de l'expression est assez poli, donc certaines personnes peuvent le trouver redondant, mais je pense que beaucoup de gens le trouvent apprécié.

Le dernier chapitre, d'une cinquantaine de pages, est un Q&R, qui est également très lisible.

Malheureusement, je pense que nous devrions faire un plan expérimental approprié, mais il est difficile de faire un plan expérimental approprié dans la pratique ou dans les affaires. .. .. Bien sûr, cela dépend du terrain.

L'essence de l'apprentissage automatique

kikaigakusyuunoessennsu.jpg

C'était un sujet brûlant, alors je l'ai acheté, mais c'était un livre avec lequel j'avais beaucoup de mal. Les connaissances préalables sont vraiment un livre rare jusqu'aux mathématiques du lycée. L'explication était également très facile à comprendre, et j'ai eu l'impression que les débutants étaient très prisés.

Le contenu est assez inégalé, et environ 270 pages sont consacrées à l'acquisition des connaissances nécessaires pour débuter l'apprentissage du machine learning (préparation de l'environnement d'exécution, bases de Python, algèbre linéaire, intégration fine, calcul numérique). Les 100 pages restantes sont composées d'apprentissage automatique.

Jusqu'à la sortie de ce livre, j'ai commencé à étudier l'apprentissage automatique, mais j'ai entendu beaucoup d'histoires selon lesquelles j'étais frustré en étudiant les connaissances préalables, alors j'ai pensé qu'un très bon livre était sorti. Si vous lisez ce livre, vous pourrez facilement vous familiariser avec l'apprentissage automatique. Je souhaite étudier l'apprentissage automatique, que dois-je faire? Je recommande ce livre sans exception à la question.

Je voulais aussi commencer avec ce livre.

Résumé de la 3e année

Mon impression honnête est que j'étudiais le marketing, la gestion, la connaissance du domaine, etc. lorsque j'ai commencé à travailler, et même si je n'avais pas beaucoup de temps pour étudier les statistiques, j'ai lu pas mal. Je pense que c'était parce que j'avais acquis des compétences de base en deuxième année et que je pouvais le lire relativement facilement à un niveau raisonnable, mais il n'y avait pas de livre difficile autre que PRML, et c'était gros qu'il soit expliqué avec soin. pense. J'ai l'impression qu'il y a beaucoup de bons livres ici.

Je pense que les bases de l'apprentissage statistique et du PRML sont toujours des livres populaires, mais qu'en est-il? Avec autant de bons livres, il n'est peut-être pas toujours nécessaire de les lire tôt. Je pense que ce n'est pas grave si vous voulez connaître les liens entre les méthodes après avoir gagné en force, ou si vous voulez étudier un ensemble de méthodes avec une personnalité cohérente. Je pense que c'est un bon livre, mais je pense qu'il y a un bon moment pour l'apprendre.

C'est la deuxième année pour les actifs (quatrième année)

L'histoire de cette année. Cette année, j'ai été influencé par un nouveau type de virus corona auquel je n'avais jamais pensé à cette période de l'année dernière. J'étais en crise au travail, donc je n'ai pas eu le temps d'étudier plus avant, comme consacrer tout mon temps au travail. Récemment, je me suis rendu compte que je devais prendre bien soin de moi et que si je travaillais de cette façon, cela pouvait avoir un effet coercitif sur les autres. En partie à cause de cela, j'ai pu gagner du temps d'étude en revenant au fonctionnement normal. .. ..

Eh bien, c'est une bonne histoire, mais cette année, j'étudiais un peu plus basique qu'avant.

Théorie probabiliste pour les statistiques, au-delà

[Théorie des probabilités pour les statistiques.jpg](Https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E5%AD%A6%E3%81%B8%E3%81%AE%E7%A2% BA% E7% 8E% 87% E8% AB% 96% E3% 80% 81% E3% 81% 9D% E3% 81% AE% E5% 85% 88% E3% 81% B8% E2% 80% 95% E3% 82% BC% E3% 83% AD% E3% 81% 8B% E3% 82% 89% E3% 81% AE% E6% B8% AC% E5% BA% A6% E8% AB% 96% E7% 9A% 84% E7% 90% 86% E8% A7% A3% E3% 81% A8% E6% BC% B8% E8% BF% 91% E7% 90% 86% E8% AB% 96% E3% 81% B8% E3% 81% AE% E6% 9E% B6% E3% 81% 91% E6% A9% 8B-% E6% B8% 85% E6% B0% B4-% E6% B3% B0% E9% 9A% 86 / dp / 4753601250 / ref = sr_1_1? __Mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & keywords =% E7% B5% B1% E8% A8% 88% E5% AD% A6% E3% 81% B8% E3% 81% AE% E7% A2% BA% E7% 8E% 87% E8% AB% 96 & qid = 1606093185 & sr = 8-1)

Vous verrez souvent la description dans divers livres que "la connaissance de la théorie des probabilités métrologiques n'est pas requise". En regardant cette description, j'ai senti que "Est-il nécessaire d'avoir des connaissances en théorie des probabilités métrologiques?" Bien sûr, j'ai été tué à plusieurs reprises.

Ce livre est parfait pour ces personnes.

En étudiant la théorie des probabilités pour comprendre les statistiques mathématiques, il a été possible d'apprendre des questions importantes de la théorie de la mesure. Je pense qu'il convient à ceux qui ne visent pas à acquérir la théorie de la théorie de la mesure elle-même, mais à cultiver la capacité de base à résister à la soi-disant application pour l'étude des statistiques mathématiques.

** "Il n'y a presque pas de problème si vous définissez $ \ Omega = R ^ d $ pour de nombreux problèmes statistiques" ** et la preuve du théorème d'extension de saut est omise ** "Ce théorème est une probabilité Il est essentiel dans la construction d'une mesure, et pour le prouver, il faut encore étudier la théorie de la mesure. Cependant, il ne sera pas si difficile de comprendre la prétention du théorème. Si ce théorème est accepté, De nombreuses étapes des premiers stades de la théorie de la mesure peuvent être omises. Si vous voulez comprendre la théorie des probabilités appliquée aux statistiques, etc., je pense qu'il vaut mieux accepter ce théorème pour le moment et passer à autre chose. "** Je pense qu'une telle description exprime bien le caractère de ce livre.

La méthode d'explication est éducative, et elle explique dans un ton de conférence plutôt que l'explication simple que l'on trouve souvent dans les livres spécialisés. Que se passerait-il si j'abandonnais les hypothèses, à quoi aboutirait cette histoire et que le nombre de personnages était fermement consacré à de telles histoires, et c'était une explication très reconnaissante pour ceux qui étudient par eux-mêmes.

Analyse fonctionnelle pour l'ingénierie

[Analyse fonctionnelle pour l'ingénierie.jpg](Https://www.amazon.co.jp/%E5%B7%A5%E5%AD%A6%E3%81%AE%E3%81%9F%E3%82%81%E3%81% AE% E9% 96% A2% E6% 95% B0% E8% A7% A3% E6% 9E% 90-% E5% B7% A5% E5% AD% A6% E3% 81% AE% E3% 81% 9F % E3% 82% 81% E3% 81% AE% E6% 95% B0% E5% AD% A6-% E5% B1% B1% E7% 94% B0-% E5% 8A% 9F / dp / 4901683624 / ref = sr_1_1? __ mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & crid = 1CEDL53GI3D3Z & dchild = 1 & keywords =% E5% B7% A5% E5% AD% A6% E3% 81 % AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E9% 96% A2% E6% 95% B0% E8% A7% A3% E6% 9E% 90 & qid = 1606095842 & sprefix =% E5% B7% A5% E5% AD% A6% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% 2Caps% 2C291 & sr = 8-1)

Ce n'est pas un livre de statistiques, mais j'ai beaucoup appris, alors je vais vous le présenter. En particulier, je pense que la compréhension s'approfondira si vous poursuivez l'étude de ce livre avant ou pendant la lecture "[Théorie des probabilités pour les statistiques, au-delà](# Théorie des probabilités pour les statistiques, au-delà)".

On dit «pour l'ingénierie», mais y a-t-il une école qui fait cela à la Faculté de génie? C'est un contenu d'avoir peur. (Il dit simplement "pour l'ingénierie", pas "le faire à la Faculté de génie".)

Il est important de noter que le mot «pour l'ingénierie» est également trompeur, et cela ne signifie pas qu'il n'est pas rigoureux et intuitif, mais qu'il traite de l'analyse fonctionnelle utilisée en ingénierie. Cela signifie que. Par conséquent, je pense que la lecture de ce livre approfondira votre compréhension des statistiques mathématiques, de l'optimisation et de la théorie des probabilités.

Cependant, heureusement pour les ingénieurs, le fait qu'il n'y ait presque aucune preuve et qu'il n'y ait presque pas d'interligne peut être considéré comme "juste pour l'ingénierie"! Dieu sérieux!

De plus, je pense que c'est une fonctionnalité que des commentaires sont ajoutés à chaque document sur la page de référence. Je ne l'ai pas suivi, mais les commentaires sont chauds, donc si vous pouvez vous le permettre, faites-le!

Introduction à la vérification des effets

[Introduction à la vérification des effets.jpg]( https://www.amazon.co.jp/%E5%8A%B9%E6%9E%9C%E6%A4%9C%E8%A8%BC%E5%85%A5%E9%96%80%E3 % 80% 9C% E6% AD% A3% E3% 81% 97% E3% 81% 84% E6% AF% 94% E8% BC% 83% E3% 81% AE% E3% 81% 9F% E3% 82 % 81% E3% 81% AE% E5% 9B% A0% E6% 9E% 9C% E6% 8E% A8% E8% AB% 96-% E8% A8% 88% E9% 87% 8F% E7% B5% 8C% E6% B8% 88% E5% AD% A6% E3% 81% AE% E5% 9F% BA% E7% A4% 8E-% E5% AE% 89% E4% BA% 95-% E7% BF% 94% E5% A4% AA / dp / 4297111179 / ref = sr_1_1? __Mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & keywords =% E5% 8A% B9% E6% 9E% 9C% E6% A4% 9C% E8% A8% BC% E5% 85% A5% E9% 96% 80 & qid = 1606097182 & sr = 8-1)

Je l'ai acheté parce que c'était un sujet brûlant, mais c'était un très bon livre parce que c'était un sujet brûlant. C'est écrit avec beaucoup de business en tête plutôt qu'un étudiant, donc j'ai trouvé que c'était très pratique.

Les critiques de livres sur le contenu sont écrites à divers endroits, je les omettrai donc ici.

Personnellement, j'ai adoré la préface et le post-scriptum, et j'ai secoué la tête de haut en bas comme un scarabée rouge. Vous pouvez voir que c'est un bon livre rien qu'en lisant ici.

Apprentissage automatique pratique avec Scikit-learn et TensorFlow

[Tokage book.jpg](https //www.amazon.co.jp/%E5%8A%B9%E6%9E%9C%E6%A4%9C%E8%A8%BC%E5%85%A5%E9%96%80%E3% 80% 9C% E6% AD% A3% E3% 81% 97% E3% 81% 84% E6% AF% 94% E8% BC% 83% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E5% 9B% A0% E6% 9E% 9C% E6% 8E% A8% E8% AB% 96-% E8% A8% 88% E9% 87% 8F% E7% B5% 8C % E6% B8% 88% E5% AD% A6% E3% 81% AE% E5% 9F% BA% E7% A4% 8E-% E5% AE% 89% E4% BA% 95-% E7% BF% 94 % E5% A4% AA / dp / 4297111179 / ref = sr_1_1? __Mk_ja_JP =% E3% 82% AB% E3% 82% BF% E3% 82% AB% E3% 83% 8A & dchild = 1 & keywords =% E5% 8A% B9 % E6% 9E% 9C% E6% A4% 9C% E8% A8% BC% E5% 85% A5% E9% 96% 80 & qid = 1606097182 & sr = 8-1)

Au travail, je n'avais que Excel et j'avais peu de possibilités d'utiliser R ou Python. J'ai utilisé R quand j'étais étudiant, donc j'utilise R pour une analyse statistique, mais je n'ai jamais utilisé du tout Python. J'ai touché Python dans [Essence of Machine Learning](# Essence of Machine Learning) et [Deep Learning from Zero](# Deep Learning from Zero), mais tous deux écrivent du code à partir de zéro, il semble donc être utilisé dans la pratique. Je l'ai acheté parce que je voulais garder les outils disponibles.

Tout d'abord, j'ai trouvé que Scikit-Learn est assez simple et pratique dans la première moitié, mais il semble que ce soit juste cela.

Au début, une histoire naturelle (et idéale) est écrite, et il semble qu'une histoire pratique sera développée tout au long de ce livre. Cependant, ce n'est que le début. Après cela, des explications sur l'algorithme et d'autres choses sont en cours d'élaboration, et cela me donne l'impression "Où avez-vous pratiqué?" C'est bien de se concentrer sur l'algorithme, mais je me demandais si je voulais en savoir plus sur les problèmes et les erreurs souvent rencontrés lors de l'utilisation de cet algorithme.

Aussi, je me demande si je n'avais pas besoin d'une explication de la théorie. Si c'est le cas, je voulais que vous l'écriviez un peu plus fermement. Cependant, le but ne doit pas être une théorie, donc je voulais que vous consacriez de l'espace pour traiter les problèmes décrits ci-dessus tout en écrivant uniquement des idées et des contours sous forme de ggrks.

Concernant le code, je pense personnellement que celui publié sur GitHub est assez bon. Je pense que c'est utile.

De plus, dans ce livre, la version de TensorFlow est 1, mais maintenant elle s'appelle TensorFlow2. .. ..

Cependant, ce fut une belle récolte d'apprendre l'utilisation de base de Scikit-Learn. Bien que je sois un peu insatisfait, je suis personnellement satisfait car j'ai pu atteindre mon objectif.

Résumé de la 4e année

Je n'ai pas eu beaucoup de temps pour étudier parce que j'ai consacré la majeure partie de mon temps à mon travail cette année, mais je pense que j'ai pu améliorer mes capacités. Les résultats au travail étaient excellents, donc je pense que j'obtiendrai une note de passage en termes de score global.

Tout au long de l'année, j'ai trouvé que c'était génial de pouvoir étudier des bases relativement simples. Et n'oubliez pas qu'il existe des livres que vous pouvez faire de votre mieux par vous-même, même si le contenu est relativement basique, et que cela devient un environnement très reconnaissant.

De plus, je ne l'utilise pas du tout au travail, ou je ne le comprends pas en écrivant du code, mais je ne peux plus dire une telle chose, donc c'est un Python populaire. Je pense que c'est un progrès que j'ai commencé à étudier. (À l'école doctorale, la classe était R à MATLAB, donc j'ai touché Python pour la première fois, mais cela devrait être facile à comprendre.)

À l'avenir, j'aimerais continuer à apprendre Python, etc., tout en introduisant l'analyse de séries chronologiques, l'apprentissage par renforcement et les statistiques bayésiennes. Le reste pense à ma carrière.

Sommaire

Au stade de la lecture de chaque livre, je pense que j'ai pu déterminer combien de connaissances j'avais et quel genre d'impressions j'avais. J'espère que cela aide quelqu'un.

Bonus: livre actuellement en cours

** ① Théorie et méthode des statistiques bayésiennes ** [Théorie et méthode des statistiques bayésiennes.jpg](Https://www.amazon.co.jp/%E3%83%99%E3%82%A4%E3%82%BA%E7%B5%B1%E8%A8%88%E3%81% AE% E7% 90% 86% E8% AB% 96% E3% 81% A8% E6% 96% B9% E6% B3% 95-% E6% B8% A1% E8% BE% BA-% E6% BE% 84% E5% A4% AB / dp / 4339024627 / ref = sr_1_1? adgrpid = 88754979296 & dchild = 1 & gclid = CjwKCAiAtej9BRAvEiwA0UAWXvyWzwLZGNMu1qfEKd3yn16KyW57h-5alyEHjckVORcdNo6Ip_wfdBoCPpYQAvD_BwE & hvadid = 410416604105 & hvdev = c & hvlocphy = 1009255 & hvnetw = g & hvqmt = e & hvrand = 7720280795536605024 & hvtargid = aud-990383411460% 3Akwd-889135189364 & hydadcr = 27491_11564684 & jp-ad- ap = 0 & mots-clés =% E3% 83% 99% E3% 82% A4% E3% 82% BA% E7% B5% B1% E8% A8% 88 +% E3% 81% AE +% E7% 90% 86% E8% AB% 96 +% E3% 81% A8 +% E6% 96% B9% E6% B3% 95 & qid = 1606113928 & sr = 8-1 & tag = googhydr-22)

Acheté pour démarrer avec les statistiques bayésiennes. C'est difficile à dire comme la rumeur dit, il est difficile de se connecter avec les connaissances que j'ai maintenant, et l'interligne est assez large, donc je ne fais aucun progrès du tout. Je suis prêt à prendre du temps pour le faire, alors je vais le faire lentement et lentement. En passant, j'ai reçu le conseil que je devrais regarder dans le chapitre 7, et c'était certainement très bien de le faire. Je pense que c'est une bonne idée de lire les chapitres 1 et 7 avant de passer au chapitre 2.


** ② Programmation d'apprentissage automatique Python ** [![Python Machine Learning Programming.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/296113/92c772d8-a9f9-302f-11ed-14a326909f64.jpeg)](https://www.amazon.co.jp/%E7%AC%AC3%E7%89%88-Python%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF% 92% E3% 83% 97% E3% 83% AD% E3% 82% B0% E3% 83% A9% E3% 83% 9F% E3% 83% B3% E3% 82% B0-% E9% 81% 94 % E4% BA% BA% E3% 83% 87% E3% 83% BC% E3% 82% BF% E3% 82% B5% E3% 82% A4% E3% 82% A8% E3% 83% B3% E3 % 83% 86% E3% 82% A3% E3% 82% B9% E3% 83% 88% E3% 81% AB% E3% 82% 88% E3% 82% 8B% E7% 90% 86% E8% AB % 96% E3% 81% A8% E5% AE% 9F% E8% B7% B5-impress-gear / dp / 4295010073 / ref = sr_1_3_sspa? 82% AB% E3% 83% 8A & crid = 1LFZPTNOVY9RI & dchild = 1 & mots-clés = python +% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92 & qid = 1606116134 & sprfix = Python% 2 & caps% 2C278 3-SPONS & psc = 1 & APLS = ZW5jcnlwdGVkUXVhbGlmaWVyPUEzVjg3REVPUlY4MzNUJmVuY3J5cHRlZElkPUEwOTQ4NDk4M0ZSN0hDTjdCRUlIWSZlbmNyeXB0ZWRBZElkPUEzQVdCWUY5Q0xCUVpBJndpZGdldE5hbWU9c3BfYXRmJmFjdGlvbj1jbGlja1JlZGlyZWN0JmRvTm90TG9nQ2xpY2s9dHJ1ZQ ==)

Je voulais un livre compatible avec TensorFlow2, et j'essayais en fait d'acheter la deuxième édition de [Tokage no Hon](apprentissage automatique pratique avec # Scikit-learn et TensorFlow), mais j'ai acheté le même livre. Je cherchais un autre livre parce que cela me gênait. Pendant ce temps, j'ai vu que la troisième édition de la programmation d'apprentissage automatique Python était sortie, alors je l'ai achetée. Je n'étais pas si inquiet parce que les 1ère et 2ème éditions avaient une bonne réputation, mais je pense que cela répond à mes besoins de savoir comment l'utiliser mieux que la théorie. Je vais.

Je n'ai pas encore fait beaucoup de progrès, mais ce que j'aime dans ce que j'ai lu jusqu'à présent, c'est comme ça. -Le code est simple et facile à comprendre. -Des commentaires sont joints à chaque code. ・ Le commentaire a atteint un point où il est horriblement irritant. ・ Si vous avez touché numpy ou scikit-learn pendant un certain temps, vous pouvez le comprendre sans difficulté.

Je vais donc continuer à faire de mon mieux. J'espère pouvoir apprendre le contenu de ces deux livres d'ici la fin de cette année.

Recommended Posts

Présentation de livres liés à la science des données.
Livres sur la science des données à lire en 2020
Livres recommandés par 3 types liés à Python
Apprenez la science des données
Préparation à l’essai de «Data Science 100 Knock (traitement des données structurées)»
Défiez 100 coups de science des données
Introduction de Python 2.7 à CentOS 6.6
Concours de science des données OPT
J'ai lu 10 livres liés aux données de séries chronologiques, je vais donc rédiger une critique.
Comment mettre en œuvre 100 coups de science des données pour les débutants en science des données (pour Windows 10 Home)
Compagnon de science des données en python, comment spécifier des éléments dans les pandas
Commentaire sur la science des données à 100 coups (P021 ~ 040)
Commentaire de la science des données 100 coups (P041 ~ 060)
Commentaire sur la science des données à 100 coups (P081 ~ 100)
Fiche technique de la science des données (Python)
Présentation de PyMySQL à Raspberry pi3
Essayez «100 coups sur la science des données» ①
Sortie du cours Infra_Data Science
Comment gérer les trames de données
Installer Networkx dans l'environnement Python 3.7 pour une utilisation dans les livres de science des données sur les logiciels malveillants
J'ai lu 13 livres qui relient la science des données aux résultats commerciaux, je vais donc rédiger une critique.