[PYTHON] Data Science 100 Knock ~ Bataille pour moins que les débutants part2

C'est un record de lutte pour frapper 100 œufs sans connaître l'œuf du scientifique des données. C'est un mystère que je puisse terminer la course. ~~ Même s'il disparaît en cours de route, pensez qu'il n'est pas donné à Qiita. ~~

100 articles frappants 100 Knock Guide

** Faites attention si vous essayez de le faire car cela inclut des spoilers **

Cette fois de 10 à 18 Première fois avec la table des matières

À partir de ce moment, les choses que j'ai écrites ne réussissent pas toujours et j'écris en regardant les réponses et en écrivant des exemples d'échecs.

10e

mine10.py


df=df_store
df[df['store_cd'].str.contains('S14')].head()

'''Le modèle de réponse'''
df_store.query("store_cd.str.startswith('S14')", engine='python').head(10)

'''Exemple d'échec'''
import re
df=df_store
df[None != re.match(r'S14.*',str(df['store_cd']))]
#>(Omission)KeyError: False

** À première vue, je me suis dit: "Si vous utilisez LIKE avec SQL, c'est un coup!?" ** ** Pour le moment, j'essaie de le résoudre en me plongeant dans le rematching ~~ heart friend ~~. Cependant, j'ai remarqué que ce n'était pas un type de chaîne de caractères, et même si je correspondais au premier caractère avec cette méthode d'écriture, il ne retournait pas avec None ~ ~ J'ai continué à provoquer KeyError en premier lieu ~ ~ J'ai cherché un autre moyen.

Ensuite, j'ai trouvé quelque chose appelé df.str.contains et j'ai été impressionné. Je l'ai utilisé en me sentant invincible parce que je pouvais écrire l'intérieur avec des expressions régulières, mais j'ai utilisé la réponse modèle ~~ et la méthode Wakanowakaranai ~~. ʻEngine = 'python'` semble être une chose magique [référence]

11ème

mine11.py


df=df_customer
df[df['customer_id'].str.contains('1$')].head()

'''Le modèle de réponse'''
df_customer.query("customer_id.str.endswith('1')", engine='python').head(10)

Un problème qui continue de nous dire la valeur de SQL. Après avoir rédigé l'article dans une certaine mesure et l'avoir examiné, relisez la référence et vérifiez la méthode ci-dessous df.str.

12 au 15

mine12.py


df= df_store
df=df[df['address'].str.contains('Yokohama')]
df

'''Le modèle de réponse'''
df_store.query("address.str.contains('Yokohama')", engine='python')

mine13.py


df=df_customer
df=df[df['status_cd'].str.contains('^[A-F]')]
df.head(10)

'''Le modèle de réponse'''
df_customer.query("status_cd.str.contains('^[A-F]', regex=True)", engine='python').head(10)

mine14.py


df=df_customer
df=df[df['status_cd'].str.contains('[0-9]$')]
df.head(10)

'''Le modèle de réponse'''
df_customer.query("status_cd.str.contains('[1-9]$', regex=True)", engine='python').head(10)

mine15.py


df=df_customer
df=df[df['status_cd'].str.contains('^[A-F].*[0-9]$')]
df.head(10)

'''Le modèle de réponse'''
df_customer.query("status_cd.str.contains('^[A-F].*[1-9]$', regex=True)", engine='python').head(10)

mine16.py


df=df_store
df=df[df['tel_no'].str.contains('[0-9]{3}-[0-9]{3}-[0-9]{4}')]
df.head(10)

'''Le modèle de réponse'''
df_store.query("tel_no.str.contains('[0-9]{3}-[0-9]{3}-[0-9]{4}', regex=True)", engine='python')

Je suis désolé, je n'ai aucune impression. Je suis désolé de ne pas avoir utilisé de requête. ~~ J'ai peur parce que je ne lance pas d'erreur en écrivant ~~

De plus, regex = True semble signifier" utiliser des expressions régulières "[référence]

17e

mine17.py


df_customer.sort_values('birth_day', ascending=True).head(10)

Un autre modèle qui vient soudainement

J'ai oublié cela, alors je l'ai écrit en le vérifiant. «Ascendant» signifie-t-il la même chose que SQL «ORDRE PAR ASC»?

18e

mine17.py


df_customer.sort_values('birth_day', ascending=False).head(10)

La différence avec SQL est qu'au lieu d'utiliser DESC, ʻascending = False`.

C'était bien jusqu'ici. Jusque là.

1 et 2 étaient des critiques avec un sentiment de correspondance digestive, mais à partir de maintenant, il y aura plus de questions quant à savoir si les connaissances peuvent ou non être combinées. ~~ Je n'ai pas assez de connaissances ~~ J'ai eu beaucoup de problèmes difficiles, donc je veux procéder à un rythme légèrement plus lent. Il y a certaines parties à sauter (21,22, etc.).

Recommended Posts

Data Science 100 Knock ~ Bataille pour moins que les débutants part3
Data Science 100 Knock ~ Bataille pour moins que les débutants part6
Data Science 100 Knock ~ Bataille pour moins que les débutants part2
Data Science 100 Knock ~ Bataille pour moins que les débutants part1
Data Science 100 Knock ~ Battle pour moins que les débutants part9
Science des données 100 coups ~ Bataille pour moins que les débutants part7
Data Science 100 Knock ~ Bataille pour moins que les débutants part4
Data Science 100 Knock ~ Bataille pour moins que les débutants part11
Data Science 100 Knock ~ Battle pour moins que les débutants part10
Science des données 100 coups ~ Bataille pour moins que les débutants part8
Commentaire sur la science des données à 100 coups (P021 ~ 040)
Commentaire sur la science des données à 100 coups (P061 ~ 080)
Commentaire de la science des données 100 coups (P041 ~ 060)
Commentaire sur la science des données à 100 coups (P081 ~ 100)
Comment mettre en œuvre 100 coups de science des données pour les débutants en science des données (pour Windows 10 Home)
"Data Science 100 Knock (traitement de données structurées)" Explication Python-007
"Data Science 100 Knock (traitement des données structurées)" Explication Python-006
"Data Science 100 Knock (traitement des données structurées)" Explication Python-001
Détection d'anomalies de données chronologiques pour les débutants
"Data Science 100 Knock (traitement des données structurées)" Explication Python-002
[Python] 100 coups sur la science des données (traitement de données structurées) 021 Explication
"Data Science 100 Knock (traitement des données structurées)" Explication Python-005
"Data Science 100 Knock (traitement de données structurées)" Explication Python-004
[Python] 100 coups sur la science des données (traitement de données structurées) 020 Explication
[Python] 100 coups sur la science des données (traitement de données structurées) 025 Explication
"Data Science 100 Knock (traitement des données structurées)" Explication Python-003
[Python] 100 coups sur la science des données (traitement de données structurées) 019 Explication
[Pratique pour les débutants] Lire ligne par ligne "Prédire les prix des maisons" de kaggle (Partie 1: Lire les données)
[Commande Linux] Liste d'options de commande moins [À voir pour les débutants]
Comment utiliser les outils d'analyse de données pour les débutants
Préparation à l’essai de «Data Science 100 Knock (traitement des données structurées)»
Construction d'environnement (Windows 10) pour 100 coups de science des données (traitement de données structurées)
Principes de base de Pandas pour les débutants ② Présentation des données de saisie